RevComm Tech Blog

コミュニケーションを再発明し 人が人を想う社会を創る

2024-07-24から1日間の記事一覧

E-BranchformerとMask CTCで高精度かつ高速な音声認識モデルを構築する

概要 こんにちは、RevCommでMiiTelの音声解析機能に関する研究開発を担当している石塚です。前回のRevComm Tech Blogにて、2023年時点でSOTAの精度であったE-Branchformer[1]を利用して日本語の音声認識モデルを構築する記事について書きました。 前回の実験…