音声認識の精度を劇的に向上、aiOlaが新技術を発表

aiOla 音声認識AIモデル発表 精度向上

イスラエルのスタートアップ企業aiOlaは、業界固有の専門用語や語彙を理解する音声認識技術の新アプローチを発表しました。

このNEWSをAIが簡単要約
  • aiOlaが専門用語を理解する音声認識技術発表
  • Whisperモデルで高精度と低誤り率達成
  • Fortune 500企業で導入、効率向上

この技術は、音声認識モデルの精度と応答性を向上させ、複雑な企業環境でも適用可能です。

OpenAIのWhisperモデルを用いた初期テストでは、単語誤り率の低減と全体的な検出精度の向上が確認されました。

aiOlaの新技術は、まず特定の専門用語を識別し、それを用いてASR(自動音声認識)デコーダをガイドする「コンテキストバイアス」アプローチです。

これにより、モデルは業界特有の用語を正確に認識できるようになります。

特に、Whisperモデルにおいては、従来のモデルよりも高い精度を実現しました。

医療データセットでのテストでは、F1スコアが96.58に達し、単語誤り率は6.15に低下しました。

この技術は、MetaのMMSモデルなど他のASRモデルにも適用可能で、再トレーニングの手間を省きながら、特定の業界に迅速に適応できるのが特徴です。

既にFortune 500企業で導入が進んでおり、例えばグローバルな運送企業では、トラックの点検時間を15分から60秒未満に短縮する成果を上げています。

aiOlaは、この技術の研究を公開し、他のAI研究チームが利用できるようにしていますが、現在はサブスクリプションベースの製品スイートを通じてのみ提供されています。

参考記事:VentureBeat

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次