Generative Error Correction: Boosting Domain-Specific Vocabulary Recognition for Speech Transcription

Research English 音声解析生成AI

Introduction Hello, I'm Santoso, and I work as a Research Engineer at RevComm Research Team. Today, I will introduce our recent study on improving domain-specific vocabulary (DSV) recognition in our products using generative error correcti…

2025-09-26

Room Simulatorを用いたデータ拡張によるNeural Speaker Diarizationモデルの実環境適応

研究紹介音声解析

RevCommで主に音声認識・音声感情認識・話者分離の研究開発を担当している石塚です。本記事では、日本音響学会2025年秋季研究発表会で発表した「Room Simulatorを用いたデータ拡張によるNeural Speaker Diarizationモデルの実環境適応」の研究について…

2025-02-03

ML@Loft #16 音声基盤モデル参加報告

イベント勉強会音声解析 Research

2025年1月21日(火)に開催されたML@Loft #16にリサーチエンジニアの石塚が登壇しました。今回はイベントの振り返りとして登壇資料と登壇者の感想を紹介します。 ml-loft.connpass.com 登壇振り返り発表タイトル: トーク解析AI MiiTelの音声処理について発…

2024-07-24

E-BranchformerとMask CTCで高精度かつ高速な音声認識モデルを構築する

音声解析技術解説

概要こんにちは、RevCommでMiiTelの音声解析機能に関する研究開発を担当している石塚です。前回のRevComm Tech Blogにて、2023年時点でSOTAの精度であったE-Branchformer[1]を利用して日本語の音声認識モデルを構築する記事について書きました。前回の実験…

2023-06-21

日本語の音声コーパスCSJでE-Branchformerの音声認識モデルを作って性能を評価する

技術解説音声解析

こんにちは、RevCommでMiiTelの音声解析機能に関する研究開発を担当している石塚です。石塚賢吉（いしづかけんきち）プリンシパルリサーチエンジニア。筑波大学大学院博士後期課程卒業。博士（工学）。日本HP株式会社にて通信事業者向けのシステム開発、…

2022-11-10

Whisperの音声認識精度および認識速度の検証

Research 音声解析

TL;DR 音声認識器Whisperの認識精度と認識速度について調査認識精度英語では論文同様の結果日本語の認識精度はドメインに依存 baseモデルの推論がドメインにより不安定ビームサーチの利用により、推論の頑健性が向上 largeモデルのCERはbaseモデルの半分…

2022-08-22

通話相手が雑音環境下にいても聞き取りやすい電話を目指してみた

研究紹介音声解析電話

RevCommで音声処理の研究開発を担当している加藤集平です。皆さんは電話の通話相手が屋外やカフェなどの雑音環境下にいるために、相手の声が聞こえづらくて苦労した経験はありませんか？本記事では、物理的な音量はそのままに雑音環境下の聞こえ（音声了解度…

#機械学習 #深層学習 #音声 #雑音 #音声強調

2022-07-13

音声解析AIによる感情認識機能の裏側〜筑波大学との共同研究を紹介します〜

研究紹介音声解析

こんにちは、RevComm にて主に MiiTel の音声解析機能に関する研究開発を担当している石塚です。石塚賢吉（いしづかけんきち）プリンシパルリサーチエンジニア。筑波大学大学院博士後期課程卒業。博士（工学）。日本HP株式会社にて通信事業者向けのシステ…

#機械学習 #深層学習 #研究開発