RevComm Tech Blog

コミュニケーションを再発明し 人が人を想う社会を創る

技術解説

E-BranchformerとMask CTCで高精度かつ高速な音声認識モデルを構築する

概要 こんにちは、RevCommでMiiTelの音声解析機能に関する研究開発を担当している石塚です。前回のRevComm Tech Blogにて、2023年時点でSOTAの精度であったE-Branchformer[1]を利用して日本語の音声認識モデルを構築する記事について書きました。 前回の実験…

フェイク音声(偽音声)検出技術の現在

本記事では、フェイク音声を検出する技術の現在について紹介します。

Introducing YoloV8: Operation and comparison to previous versions of the object detection model

This article is the English version of Yuta Takase's blog post. Table of contents Table of contents 1. Introduction 2. What is YOLO? 3. YOLOv8 4. YOLOv8 model size 5. Changes with YOLOv5 6. YOLOv8's building and inference execution Inferen…

日本語の音声コーパスCSJでE-Branchformerの音声認識モデルを作って性能を評価する

こんにちは、RevCommでMiiTelの音声解析機能に関する研究開発を担当している石塚です。 2023年1月に開催された国際会議IEEE Workshop on Spoken Language and Technology (SLT) 2022で発表されたE-Branchformer: Branchformer with Enhanced Merging for Spe…

物体検出モデルYOLOv8の紹介: 動作手順や過去のバージョンとの比較

1. はじめに こんにちは、RevComm Researchでリサーチエンジニアとして働いている髙瀬です。 2023年1月上旬にUltralytics社からYOLOv8が公開されました。 今回はYOLOv8について、v5との変更点や動かし方を紹介していこうと思います。 2. YOLOとは 非常に有名…