Research
こんにちは、 RevComm Research Dept. Development Groupのid:tmotegiです。趣味は積読と日本酒を嗜んでおります。昨日は仙禽の雪だるまを飲みました。現世で2度目のアドベントカレンダーなので緊張します。 この記事は RevComm Advent Calendar 2023 、15日…
本記事では、フェイク音声を検出する技術の現在について紹介します。
This article is the English version of Yuta Takase's blog post. Table of contents Table of contents 1. Introduction 2. What is YOLO? 3. YOLOv8 4. YOLOv8 model size 5. Changes with YOLOv5 6. YOLOv8's building and inference execution Inferen…
RevComm Researchの加藤集平です。8月下旬に音声処理のトップカンファレンスであるINTERSPEECHで発表するため、また引き続いて行われたISCA Speech Synthesis Workshop (SSW) に参加するためにヨーロッパに出張をしてきました。今回の記事では、INTERSPEECH,…
This blog post is the work of Hongkai Li, edited by Tolmachev Arseny. The authors belong to Works Applications and are working for RevComm. TL;DR Background Evaluation Metrics Experiments Datasets and Systems Results Correlation Among the …
はじめに 対話要約手法の概要 抽出的要約 抽象的要約 その他 近年の研究 Pegasus DialogLM ChatGPT/GPT3 まとめ 引用 はじめに この記事は『対話要約研究の最前線 前編 〜データセットと評価指標の紹介〜』の続きです。 RevCommは電話営業や顧客応対の通話を…
1. はじめに こんにちは、RevComm Researchでリサーチエンジニアとして働いている髙瀬です。 2023年1月上旬にUltralytics社からYOLOv8が公開されました。 今回はYOLOv8について、v5との変更点や動かし方を紹介していこうと思います。 2. YOLOとは 非常に有名…
Research Engeneerの大野より、対話要約に関する研究について前編と後編の2回に分けて解説します。 前編ではデータセットの紹介やドメイン領域ごとの課題、評価手法ついて触れていきます。
RevComm Advent Calendar 2022 の 20 日目の記事です。Research 開発部の服部より、RevComm における機械学習の推論環境の技術変遷について紹介します。
RevComm Advent Calender 1日目の記事です。RevComm のリサーチディレクターの橋本がスタートアップ企業における研究開発(Research & Development)の意義について書いていきます。
TL;DR 音声認識器Whisperの認識精度と認識速度について調査 認識精度 英語では論文同様の結果 日本語の認識精度はドメインに依存 baseモデルの推論がドメインにより不安定 ビームサーチの利用により、推論の頑健性が向上 largeモデルのCERはbaseモデルの半分…