OpenAIのDeep Researchがオープンソース化!Hugging Faceが公開した「Open Deep Research」とは?

OpenAI Deep Research オープンソース化 Hugging Face Open Deep Research
押さえておきたいポイント
  • OpenAIが発表したDeep Researchのオープンソース版が登場
  • GAIAベンチマークで高得点を記録し、複雑な質問に対しても対応可能
  • コードベースのエージェントのため大幅に精度を向上

2025年2月4日、OpenAIがリリースしたDeep Researchのオープンソース版である「Open Deep Research」がリリースされました!

Open Deep Researchは、24時間のハッカソン形式でDeep Researchに匹敵するシステムを構築し、GAIAベンチマークで好成績を残しています。

本記事ではOpen Deep Researchの概要から使い方、性能について解説をしたいと思います。本記事を最後まで読めば、Open Deep Researchのことを理解できるようになるでしょう。

ぜひ最後までお読みください!

目次

Open Deep Researchの概要

Open Deep ResearchはOpen AIのDeep Researchのオープンソース版として、Hugging Faceの開発者チームが発表を行いました。

OpenAIのシステムを再現するため、Hugging Faceのエージェントフレームワークであるsmolagentsを活用し、24時間のハッカソン形式でDeep Researchに匹敵するシステムを構築しました。

なお、公式ページでは現在も開発が進んでおり、Open Deep Researchは初期段階で改善の余地があることが報告されています。例えば、より高度なWeb検索機能や他のファイル形式への対応などです。

エージェントフレームワークはLLMの性能を大きく向上させる重要な仕組みです。このフレームワークを使うことで、LLMがウェブ検索やPDFの読解といった作業を自動で実行し、それらを適切な順番で整理しながら処理できます。

その結果、LLM単体で使うよりも、より高度で効率的なタスク遂行が可能になります。

Open AIのDeep Researchとは

Deep Researchは2025/02/03にOpenAIが発表した新たなAIエージェント。

参考:https://openai.com/index/introducing-deep-research/

ChatGPTのProに契約することで利用できます。Deep Researchはユーザーが与えたタスクに対してWeb検索を用い、自動で実行してくれます。Deep Researchでは、o3の最適化バージョンを使っており、Web検索とデータ分析を強化したもの。

Deep Researchは与えられたタスクに対して、自身が調べた結果をまとめ、出力をしてくれます。

Humanity’s Last Examでは、従来のGPTモデルを大幅に上回る26.6%の正答率を達成し、GAIAベンチマーク(リアルワールドの課題を評価する指標)で最高レベルの精度を記録しています。

なお、Deep Researchは今後、Plus・Teamプランに拡大予定であり、「Deep Research」と他のエージェント機能(Operatorなど)を組み合わせることで、より高度なタスクの自動化を実現予定になっています。

OpenAIのDeep Researchについては、以下の記事をご覧ください。

Open Deep Researchの性能

Open Deep Researchの性能はGAIAというベンチマークで評価されています。GAIAはGeneral AI Assistants benchmarkの略でAIの知的能力を測定するために、現実世界の質問を用い、それに対するAIの反応を評価します。

GAIAベンチマークは合計466の質問から構成されており、人間が92%の正答率を達成するのに対し、GPT-4(プラグイン使用)ですら15%程度の正答率にとどまる結果。

GAIAの結果は以下です。

モデルGAIAスコア
GPT-4(単体使用)7%未満
OpenAI Deep Research67.36%
Magentic-One(オープンソースの先行システム)46%
Open Deep Research(Hugging Face版)54%

Open Deep Researchは開発初期段階でありながら、過去の最高スコアであった46%からスコアを向上させており、開発が今後より進んでいけばOpenAI Deep Researchの結果を追い越すかもしれません。

スコアが46%→54%になった要因として、コードエージェントを導入したことが大きいとされています。

コードエージェントの導入

OpenAI Deep ResearchではエージェントがJSONではなくPythonで記述・実行できる仕組みを採用しており、これがコードエージェントです。

参考;https://huggingface.co/blog/open-deep-research

コードエージェントを導入することで処理が簡潔になり実行ステップが30%軽減し、より正確な指示を出すことができるのでタスクの成功率が向上したとされています。

なお、JSON形式とPython形式ではベンチマークが33%と54%でコードエージェントの性能についても報告されています。

Open Deep Researchの特徴

Open Deep Researchの特徴としては、OpenAIのDeep Researchのオープンソース版であり、開発初期段階ではあるもののGAIAベンチマークがDeep Researchに追いつこうとしている点です。

Deep ResearchでできることはOpen Deep Researchでも行うことができ、、エージェントがWeb検索やデータ収集、テキスト解析などを自動で実行します。

また、前述したようにコードエージェントを採用しているため、パフォーマンスと性能が向上している点も特徴と言えるでしょう。さらに、LLM単体でタスクの回答を導き出すよりも、Open Deep Researchを使った方がより正確でより論理的な出力が可能です。

開発初期段階であるため、今後の課題が明確なのもある意味特徴的と言えます。

今後の課題として画像や動画の処理、より高度なWeb操作、より強力なオープンソースLLMを活用するとされています。

Open Deep Researchのライセンス

Open Deep Researchのライセンスに関する記載はありませんでしたが、オープンソースであることからおそらく商用利用など可能と考えられますが、明言されてから商用利用するのが良いでしょう。

利用用途可否
商用利用不明
改変不明
配布不明
特許使用不明
私的使用不明

なお、AIエージェントがブラウザを操作するBrowser useについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

Open Deep Researchの使い方

Open Deep ResearchはGradioで利用することができます。

参考:https://m-ric-open-deep-research.hf.space/

ただし、デモ版ではエラーが生じることがあるようなので、根気強く利用するのが良いでしょう。ちなみに私は5回くらい実行しましたがそのうち2回はエラー表示、3回は何も出力されませんでした。

今後の開発進行に期待です。

Open Deep Researchの活用事例

Open Deep Researchの考えられる活用事例をいくつか紹介します。今後、開発が進み、安定して利用することができるようになったらぜひ試してみたい事例です。

論文サーベイ

まずは論文サーベイです。

研究を行っている方、研究はしていないけど日頃から論文に触れている方など、論文サーベイに時間を取られていませんか?

そんな時にはOpen Deep Researchを使って「〇〇に関連する2025年に投稿された論文を探して」とタスクを与えます。まず、論文を探すことにかなりの時間がかかりますのでOpen Deep Researchで自動化できるとかなりの時間短縮になります。

また、収集された論文をもとに論文の要点を抽出し、要約、論文同士のつながりなどを分析してもらうこともできるでしょう。

市場調査・競合調査

マーケティングで必要になる市場調査や競合調査も人力ではかなりの時間がかかります。それをOpen Deep Researchに実行してもらいましょう。

Web検索を通じて競合企業のニュースやレポート、価格調査、商品レビューの分析を行い、自社との差別化ポイントを抽出できるでしょう。Open Deep Researchはデータ分析にも強いため、データ分析まで行ってもらうことで、意思決定の一助にすることができます。

一方でファクトチェックは必ず行うようにした方が良いと言えます。

オウンドメディア執筆

オウンドメディアで執筆活動を行う上でもOpen Deep Researchは重宝できそうです。記事を書く際には事前にリサーチをしてから執筆活動に移る方が多いと思います。

ただ、この事前リサーチがかなり時間を要します。そんな時にOpen Deep Researchがあれば、事前リサーチを自動化することができ、執筆活動に集中できます。

また、執筆する内容について競合調査を組み合わせることで、独自の視点から執筆をすることもできるでしょう。

これまでの業務の中で「同じ作業の繰り返しで自分がやる必要あるのかな?」と感じるタスクに関してはOpen Deep Researchを使えば効率化ができます。

なお、自分でエラー修正できるAIエージェントであるbabyagi-2oについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

まとめ

本記事ではOpen Deep Researchの概要から使い方、性能についてお伝えをしました。OpenAIのDeep Researchが登場はしましたが、月額3万円程度のProに加入していないと利用することができないので、Open Deep Researchは非常に嬉しいリリースです。

これまで人力で行っていたデータ収集をAIエージェントが自動で実行してくれるとなると、業務効率化がより一層計れそうですね。一つ注意点としては、Web情報は玉石混合ですので、Open Deep Researchがまとめた結果を鵜呑みするのではなく、ファクトチェックの癖はつけておいた方がいいかもしれません。

ぜひ本記事を参考にOpen Deep Researchを使ってみてください。

最後に

いかがだったでしょうか

Open Deep ResearchなどのAIエージェントを活用することで、論文調査や市場分析などのリサーチ業務を自動化し、大幅な時間短縮が可能です。精度の高いデータ収集と分析で、より戦略的な意思決定を実現しませんか?

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
無料相談

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • 翔平

    総合病院で10年間理学療法士として勤務し、患者のリハビリテーション支援に従事。その後、Pythonを独学で学び、データ分析のスキルを活かしてデータアナリストに転身。 データ分析の知見を活かし、主にテクニカル記事を担当。趣味はキックボクシング。

  • URLをコピーしました!
  • URLをコピーしました!
目次