OpenAIのDeep Researchがオープンソース化！Hugging Faceが公開した「Open Deep Research」とは？

2025-02-06

OpenAI Deep Research オープンソース化 Hugging Face Open Deep Research

押さえておきたいポイント

OpenAIが発表したDeep Researchのオープンソース版が登場
GAIAベンチマークで高得点を記録し、複雑な質問に対しても対応可能
コードベースのエージェントのため大幅に精度を向上

2025年2月4日、OpenAIがリリースしたDeep Researchのオープンソース版である「Open Deep Research」がリリースされました！

Open Deep Researchは、24時間のハッカソン形式でDeep Researchに匹敵するシステムを構築し、GAIAベンチマークで好成績を残しています。

Introducing open-Deep-Research by @huggingface ! 💥

Deep Research from @OpenAI is really good… But it's closed, as usual.

> So with a team of cracked colleagues, we set ourselves a 24hours deadline to replicate and open-source Deep Research!

➡️ We built open-Deep-Research,… pic.twitter.com/GE9tvjW0BA
— Aymeric (m-ric) (@AymericRoucher) February 4, 2025

本記事ではOpen Deep Researchの概要から使い方、性能について解説をしたいと思います。本記事を最後まで読めば、Open Deep Researchのことを理解できるようになるでしょう。

ぜひ最後までお読みください！

＼生成AIを活用して業務プロセスを自動化／

【無料】専門家に相談する

Open Deep Researchの概要

Open Deep ResearchはOpen AIのDeep Researchのオープンソース版として、Hugging Faceの開発者チームが発表を行いました。

OpenAIのシステムを再現するため、Hugging Faceのエージェントフレームワークであるsmolagentsを活用し、24時間のハッカソン形式でDeep Researchに匹敵するシステムを構築しました。

なお、公式ページでは現在も開発が進んでおり、Open Deep Researchは初期段階で改善の余地があることが報告されています。例えば、より高度なWeb検索機能や他のファイル形式への対応などです。

エージェントフレームワークはLLMの性能を大きく向上させる重要な仕組みです。このフレームワークを使うことで、LLMがウェブ検索やPDFの読解といった作業を自動で実行し、それらを適切な順番で整理しながら処理できます。

その結果、LLM単体で使うよりも、より高度で効率的なタスク遂行が可能になります。

Open AIのDeep Researchとは

Deep Researchは2025/02/03にOpenAIが発表した新たなAIエージェント。

**参考：https://openai.com/index/introducing-deep-research/**

ChatGPTのProに契約することで利用できます。Deep Researchはユーザーが与えたタスクに対してWeb検索を用い、自動で実行してくれます。Deep Researchでは、o3の最適化バージョンを使っており、Web検索とデータ分析を強化したもの。

Deep Researchは与えられたタスクに対して、自身が調べた結果をまとめ、出力をしてくれます。

Humanity’s Last Examでは、従来のGPTモデルを大幅に上回る26.6%の正答率を達成し、GAIAベンチマーク(リアルワールドの課題を評価する指標)で最高レベルの精度を記録しています。

なお、Deep Researchは今後、Plus・Teamプランに拡大予定であり、「Deep Research」と他のエージェント機能(Operatorなど)を組み合わせることで、より高度なタスクの自動化を実現予定になっています。

OpenAIのDeep Researchについては、以下の記事をご覧ください。

WEEL

【ChatGPT deep research】精度の高いレポートが生成可能！特徴や活用方法を解説 | WEEL ChatGPT deep researchは、OpenAIが2025年2月に公開した新機能で、高精度なレポートを自動生成できます。本記事では、deep researchの概要や使い方、活用事例を詳しく解説…

Open Deep Researchの性能

Open Deep Researchの性能はGAIAというベンチマークで評価されています。GAIAはGeneral AI Assistants benchmarkの略でAIの知的能力を測定するために、現実世界の質問を用い、それに対するAIの反応を評価します。

GAIAベンチマークは合計466の質問から構成されており、人間が92%の正答率を達成するのに対し、GPT-4(プラグイン使用)ですら15%程度の正答率にとどまる結果。

GAIAの結果は以下です。

モデル	GAIAスコア
GPT-4(単体使用)	7%未満
OpenAI Deep Research	67.36%
Magentic-One(オープンソースの先行システム)	46%
Open Deep Research(Hugging Face版)	54%

Open Deep Researchは開発初期段階でありながら、過去の最高スコアであった46％からスコアを向上させており、開発が今後より進んでいけばOpenAI Deep Researchの結果を追い越すかもしれません。

スコアが46％→54％になった要因として、コードエージェントを導入したことが大きいとされています。

コードエージェントの導入

OpenAI Deep ResearchではエージェントがJSONではなくPythonで記述・実行できる仕組みを採用しており、これがコードエージェントです。

**参考；https://huggingface.co/blog/open-deep-research**

コードエージェントを導入することで処理が簡潔になり実行ステップが30％軽減し、より正確な指示を出すことができるのでタスクの成功率が向上したとされています。

なお、JSON形式とPython形式ではベンチマークが33％と54％でコードエージェントの性能についても報告されています。

Open Deep Researchの特徴

Open Deep Researchの特徴としては、OpenAIのDeep Researchのオープンソース版であり、開発初期段階ではあるもののGAIAベンチマークがDeep Researchに追いつこうとしている点です。

Deep ResearchでできることはOpen Deep Researchでも行うことができ、、エージェントがWeb検索やデータ収集、テキスト解析などを自動で実行します。

また、前述したようにコードエージェントを採用しているため、パフォーマンスと性能が向上している点も特徴と言えるでしょう。さらに、LLM単体でタスクの回答を導き出すよりも、Open Deep Researchを使った方がより正確でより論理的な出力が可能です。

開発初期段階であるため、今後の課題が明確なのもある意味特徴的と言えます。

今後の課題として画像や動画の処理、より高度なWeb操作、より強力なオープンソースLLMを活用するとされています。

Open Deep Researchのライセンス

Open Deep Researchのライセンスに関する記載はありませんでしたが、オープンソースであることからおそらく商用利用など可能と考えられますが、明言されてから商用利用するのが良いでしょう。

利用用途	可否
商用利用	不明
改変	不明
配布	不明
特許使用	不明
私的使用	不明

なお、AIエージェントがブラウザを操作するBrowser useについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

WEEL

【Browser Use】AIエージェントが自動でブラウザを操作！概要と使い方&実践ガイド | WEEL 「Browser Use」を使って、ブラウザ操作の自動化を簡単に実現！AIエージェントがウェブページの要素を認識し、複雑な操作を自動で実行。複数のLLM（GPT-4、Claude 3、Llama…

Open Deep Researchの使い方

Open Deep ResearchはGradioで利用することができます。

**参考：https://m-ric-open-deep-research.hf.space/**

ただし、デモ版ではエラーが生じることがあるようなので、根気強く利用するのが良いでしょう。ちなみに私は5回くらい実行しましたがそのうち2回はエラー表示、3回は何も出力されませんでした。

今後の開発進行に期待です。

Open Deep Researchの活用事例

Open Deep Researchの考えられる活用事例をいくつか紹介します。今後、開発が進み、安定して利用することができるようになったらぜひ試してみたい事例です。

論文サーベイ

まずは論文サーベイです。

研究を行っている方、研究はしていないけど日頃から論文に触れている方など、論文サーベイに時間を取られていませんか？

そんな時にはOpen Deep Researchを使って「〇〇に関連する2025年に投稿された論文を探して」とタスクを与えます。まず、論文を探すことにかなりの時間がかかりますのでOpen Deep Researchで自動化できるとかなりの時間短縮になります。

また、収集された論文をもとに論文の要点を抽出し、要約、論文同士のつながりなどを分析してもらうこともできるでしょう。

市場調査・競合調査

マーケティングで必要になる市場調査や競合調査も人力ではかなりの時間がかかります。それをOpen Deep Researchに実行してもらいましょう。

Web検索を通じて競合企業のニュースやレポート、価格調査、商品レビューの分析を行い、自社との差別化ポイントを抽出できるでしょう。Open Deep Researchはデータ分析にも強いため、データ分析まで行ってもらうことで、意思決定の一助にすることができます。

一方でファクトチェックは必ず行うようにした方が良いと言えます。

オウンドメディア執筆

オウンドメディアで執筆活動を行う上でもOpen Deep Researchは重宝できそうです。記事を書く際には事前にリサーチをしてから執筆活動に移る方が多いと思います。

ただ、この事前リサーチがかなり時間を要します。そんな時にOpen Deep Researchがあれば、事前リサーチを自動化することができ、執筆活動に集中できます。

また、執筆する内容について競合調査を組み合わせることで、独自の視点から執筆をすることもできるでしょう。

これまでの業務の中で「同じ作業の繰り返しで自分がやる必要あるのかな？」と感じるタスクに関してはOpen Deep Researchを使えば効率化ができます。

なお、自分でエラー修正できるAIエージェントであるbabyagi-2oについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

WEEL

【babyagi-2o】自分でエラー修正できるAIエージェント！GPT-4oと比較してみた | WEEL babyagi-2oは自己修正機能を持つ自律型エージェントで、ユーザーのタスクに基づきプログラムを生成し、エラーが発生しても自動で修正します。この記事では、babyagi-2oの機…

まとめ

本記事ではOpen Deep Researchの概要から使い方、性能についてお伝えをしました。OpenAIのDeep Researchが登場はしましたが、月額3万円程度のProに加入していないと利用することができないので、Open Deep Researchは非常に嬉しいリリースです。

これまで人力で行っていたデータ収集をAIエージェントが自動で実行してくれるとなると、業務効率化がより一層計れそうですね。一つ注意点としては、Web情報は玉石混合ですので、Open Deep Researchがまとめた結果を鵜呑みするのではなく、ファクトチェックの癖はつけておいた方がいいかもしれません。

ぜひ本記事を参考にOpen Deep Researchを使ってみてください。

最後に

いかがだったでしょうか

Open Deep ResearchなどのAIエージェントを活用することで、論文調査や市場分析などのリサーチ業務を自動化し、大幅な時間短縮が可能です。精度の高いデータ収集と分析で、より戦略的な意思決定を実現しませんか？

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです！

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70％自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80％削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ