米国議会図書館、AIスタートアップの注目の的に
米国議会図書館(Library of Congress)が、AIスタートアップ企業からの関心を集めています。
- 米国議会図書館がAI企業の注目を集めています。
- パブリックドメインの資料が無料で利用可能です。
- AIモデルのバイアスと誤情報のリスクが課題です。
1800年に合衆国議会の図書室として設立されたこの図書館は、1億8000万点以上の書籍や資料を所蔵しており、トーマス・ジェファーソンの手紙や15世紀の手書き聖書など、貴重な歴史的資料も多く含まれています。
特に注目されているのは、著作権が切れた資料がパブリックドメインとして利用可能であることです。
AI企業は、大規模言語モデル(LLM)の訓練に適したデータを求める中、法的なリスクがないこれらのデータに目をつけています。
多くの企業やアーティストが自身のデータをスクレイピングから守る中、米国議会図書館は無料で広範なデジタルアーカイブを提供しているため、AIの訓練資源として非常に魅力的です。
AI企業はAPIを介して図書館のデータにアクセスできる一方、一般的なスクレイピングは禁止されています。
アクセスが増加しアーカイブの速度が低下するのを防ぐための措置です。
しかし、AI開発企業の関心はそれだけではなく、OpenAIやアマゾン、マイクロソフトといった大手企業も、図書館を顧客に迎え、図書館業務の効率化に役立つAIツールを提案しています。
一方で、現代のデータで訓練されたAIモデルには「今の時代のバイアス」があり、歴史的な事象を誤認する問題も浮上しています。
例えば、AIが過去の人々を現代的なガジェットを持つように誤って解釈することがあり、さらに米議会調査局が開発中のAIツールでは、法案の要約で誤った情報を生成する問題も報告されています。
米国議会図書館は、今後もデジタル化を進め、AI企業に対するデータ提供を拡大する計画です。
「連邦機関や図書館は、経済発展を支えるデータの基盤です」とデジタル戦略部長のナタリー・スミス氏は述べ、今後もAIの利用を慎重に進めながら、社会的な価値を提供することを目指しています。
参考記事:Fobes Japan
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。