RevComm Tech Blog

コミュニケーションを再発明し 人が人を想う社会を創る

Research

IPSJ第266回自然言語処理・第158回音声言語情報処理合同研究発表会: 登壇・参加レポート

※この記事はリサーチエンジニアのJennifer Santosoによる記事『IPSJ 266th Natural Language Processing & 158th Speech Language Information Processing Joint Research Presentation Meeting - Presentation and Participation Report』を翻訳したもので…

IPSJ 266th Natural Language Processing & 158th Speech Language Information Processing Joint Research Presentation Meeting - Presentation and Participation Report

Introduction This is Santoso from RevComm Research. I participated in a research meeting held in mid-December and presented our ongoing research results. This time, RevComm Research reported on our latest findings under the theme "Generati…

Speaker Diarization with Language Model

Background Speaker diarization has become increasingly valuable in applications designed for high-noise environments, often tailored for complex audio settings, emphasizing robust audio processing capabilities. Initially, the development o…

Generative Error Correction: Boosting Domain-Specific Vocabulary Recognition for Speech Transcription

Introduction Hello, I'm Santoso, and I work as a Research Engineer at RevComm Research Team. Today, I will introduce our recent study on improving domain-specific vocabulary (DSV) recognition in our products using generative error correcti…

評価者としてLLMの判定結果はどこまで信頼できるのか?

この記事はRevComm Advent Calendar 2025 8日目の記事です。 qiita.com 1. はじめに こんにちは。Research Engineerの髙瀬です。 近年、大規模言語モデル(LLM)の性能向上により、テキスト生成や分類タスク、さらには評価やアノテーションなど、様々な場面…

心理的安全性を高め、工数を減らす「校正者」としてのAIレビュー導入実践事例

著者: Researchチーム 春日 1. はじめに 「レビューがいつまでも終わらない」「人によって指摘の粒度がバラバラ」「些細な指摘で心理的安全性が削られる」……。 開発規模の拡大や専門性が深まるにつれ、ドキュメントやコードのレビューにまつわる悩みは、ど…

ML@Loft #16 音声基盤モデル参加報告

2025年1月21日(火)に開催されたML@Loft #16にリサーチエンジニアの石塚が登壇しました。 今回はイベントの振り返りとして登壇資料と登壇者の感想を紹介します。 ml-loft.connpass.com 登壇振り返り 発表タイトル: トーク解析AI MiiTelの音声処理について 発…

AWS Inf2の導入による音声感情認識の爆速化とコスト削減

こんにちは、 RevComm Research Dept. Development Groupのid:tmotegiです。趣味は積読と日本酒を嗜んでおります。昨日は仙禽の雪だるまを飲みました。現世で2度目のアドベントカレンダーなので緊張します。 この記事は RevComm Advent Calendar 2023 、15日…

フェイク音声(偽音声)検出技術の現在

本記事では、フェイク音声を検出する技術の現在について紹介します。

Introducing YoloV8: Operation and comparison to previous versions of the object detection model

This article is the English version of Yuta Takase's blog post. Table of contents Table of contents 1. Introduction 2. What is YOLO? 3. YOLOv8 4. YOLOv8 model size 5. Changes with YOLOv5 6. YOLOv8's building and inference execution Inferen…

音声処理系国際会議INTERSPEECH・SSW出張レポート

RevComm Researchの加藤集平です。8月下旬に音声処理のトップカンファレンスであるINTERSPEECHで発表するため、また引き続いて行われたISCA Speech Synthesis Workshop (SSW) に参加するためにヨーロッパに出張をしてきました。今回の記事では、INTERSPEECH,…

Evaluating Summarization Evaluation

This blog post is the work of Hongkai Li, edited by Tolmachev Arseny. The authors belong to Works Applications and are working for RevComm. TL;DR Background Evaluation Metrics Experiments Datasets and Systems Results Correlation Among the …

対話要約の解説 後編 〜近年の研究の紹介〜

はじめに 対話要約手法の概要 抽出的要約 抽象的要約 その他 近年の研究 Pegasus DialogLM ChatGPT/GPT3 まとめ 引用 はじめに この記事は『対話要約研究の最前線 前編 〜データセットと評価指標の紹介〜』の続きです。 RevCommは電話営業や顧客応対の通話を…

物体検出モデルYOLOv8の紹介: 動作手順や過去のバージョンとの比較

1. はじめに こんにちは、RevComm Researchでリサーチエンジニアとして働いている髙瀬です。 2023年1月上旬にUltralytics社からYOLOv8が公開されました。 今回はYOLOv8について、v5との変更点や動かし方を紹介していこうと思います。 2. YOLOとは 非常に有名…

対話要約研究の最前線 前編 〜データセットと評価指標の紹介〜

Research Engeneerの大野より、対話要約に関する研究について前編と後編の2回に分けて解説します。 前編ではデータセットの紹介やドメイン領域ごとの課題、評価手法ついて触れていきます。

RevComm Research 開発部の技術変遷を紹介します(2022 年 12 月版)

RevComm Advent Calendar 2022 の 20 日目の記事です。Research 開発部の服部より、RevComm における機械学習の推論環境の技術変遷について紹介します。

スタートアップ企業にとってのR&D

RevComm Advent Calender 1日目の記事です。RevComm のリサーチディレクターの橋本がスタートアップ企業における研究開発(Research & Development)の意義について書いていきます。

Whisperの音声認識精度および認識速度の検証

TL;DR 音声認識器Whisperの認識精度と認識速度について調査 認識精度 英語では論文同様の結果 日本語の認識精度はドメインに依存 baseモデルの推論がドメインにより不安定 ビームサーチの利用により、推論の頑健性が向上 largeモデルのCERはbaseモデルの半分…