熊本大学とTOPPAN、AIで古文書5万枚を解読

熊本大学 TOPPAN AIで古文書解読

熊本大学とTOPPAN株式会社は26日、熊本大学が寄託を受けている「細川家文書」のうち、専門家でも解読が困難な約5万枚の古文書をAI-OCRを用いて短期間で解読し、約950万文字のテキストデータを生成したと発表しました。両者はこのシステムを構築し、地域の災害記録などの網羅的な調査を開始しています。

このNEWSをAIが簡単要約
  • 熊本大学とTOPPANが古文書をAIで解読。
  • 約5万枚の文書をAI-OCRで解析成功。
  • 災害関連記述を含む300件以上発見。

TOPPANは2015年から国文学研究資料館と共同でくずし字AI-OCR技術の開発を進めており、2017年からは古文書解読サービス「ふみのは」を提供しています。

一方、熊本大学は永青文庫から約5万7000点の資料を寄託されており、両者は2021年から文献資料の新たな調査手法を検討し、今回の成果を得ました。

AI-OCRで生成されたテキストデータを基に、江戸時代の細川藩の社会的事件や統治制度の変化を示す資料を即時に検索できるシステムも構築されました。

今回の調査では災害関連の記述が300件以上発見され、今後の地域防災研究にも活用される予定です。

参考記事:クラウドWatch

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次