音声認識の精度を劇的に向上、aiOlaが新技術を発表

2024-07-04

aiOla 音声認識AIモデル発表精度向上

イスラエルのスタートアップ企業aiOlaは、業界固有の専門用語や語彙を理解する音声認識技術の新アプローチを発表しました。

このNEWSをAIが簡単要約

aiOlaが専門用語を理解する音声認識技術発表
Whisperモデルで高精度と低誤り率達成
Fortune 500企業で導入、効率向上

この技術は、音声認識モデルの精度と応答性を向上させ、複雑な企業環境でも適用可能です。

OpenAIのWhisperモデルを用いた初期テストでは、単語誤り率の低減と全体的な検出精度の向上が確認されました。

aiOlaの新技術は、まず特定の専門用語を識別し、それを用いてASR（自動音声認識）デコーダをガイドする「コンテキストバイアス」アプローチです。

これにより、モデルは業界特有の用語を正確に認識できるようになります。

特に、Whisperモデルにおいては、従来のモデルよりも高い精度を実現しました。

医療データセットでのテストでは、F1スコアが96.58に達し、単語誤り率は6.15に低下しました。

この技術は、MetaのMMSモデルなど他のASRモデルにも適用可能で、再トレーニングの手間を省きながら、特定の業界に迅速に適応できるのが特徴です。

既にFortune 500企業で導入が進んでおり、例えばグローバルな運送企業では、トラックの点検時間を15分から60秒未満に短縮する成果を上げています。

aiOlaは、この技術の研究を公開し、他のAI研究チームが利用できるようにしていますが、現在はサブスクリプションベースの製品スイートを通じてのみ提供されています。

参考記事：VentureBeat

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

メルマガに登録する

資料をダウンロードする

URLをコピーしました！

URLをコピーしました！

「日本一透明性の高いAIプロフェッショナル集団」
を目指して

私たちは、AIに関わるすべての人に向けて、透明性の高い適切な情報発信と開発を行います。
「WEELは、一番地に足ついたAI情報を教えてくれる」
と思っていただけるよう、透明性高い事業運営を行なって参ります。

私たちは、AIに関わるすべての人に向けて、
透明性の高い適切な情報発信と開発を行います。
「WEELは、
一番地に足ついたAI情報を教えてくれる」
と思っていただけるよう、
透明性高い事業運営を行なって参ります。

無料で相談してみる

会社紹介資料ダウンロード

通勤時間で読める

生成AIメールマガジンを読む