音声認識の精度を劇的に向上、aiOlaが新技術を発表
イスラエルのスタートアップ企業aiOlaは、業界固有の専門用語や語彙を理解する音声認識技術の新アプローチを発表しました。
- aiOlaが専門用語を理解する音声認識技術発表
- Whisperモデルで高精度と低誤り率達成
- Fortune 500企業で導入、効率向上
この技術は、音声認識モデルの精度と応答性を向上させ、複雑な企業環境でも適用可能です。
OpenAIのWhisperモデルを用いた初期テストでは、単語誤り率の低減と全体的な検出精度の向上が確認されました。
aiOlaの新技術は、まず特定の専門用語を識別し、それを用いてASR(自動音声認識)デコーダをガイドする「コンテキストバイアス」アプローチです。
これにより、モデルは業界特有の用語を正確に認識できるようになります。
特に、Whisperモデルにおいては、従来のモデルよりも高い精度を実現しました。
医療データセットでのテストでは、F1スコアが96.58に達し、単語誤り率は6.15に低下しました。
この技術は、MetaのMMSモデルなど他のASRモデルにも適用可能で、再トレーニングの手間を省きながら、特定の業界に迅速に適応できるのが特徴です。
既にFortune 500企業で導入が進んでおり、例えばグローバルな運送企業では、トラックの点検時間を15分から60秒未満に短縮する成果を上げています。
aiOlaは、この技術の研究を公開し、他のAI研究チームが利用できるようにしていますが、現在はサブスクリプションベースの製品スイートを通じてのみ提供されています。
参考記事:VentureBeat
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。