自律型AIエージェントまとめ!厳選したおすすめAIツール18選
WEELメディア事業部AIライターの2scです。
みなさん、ChatGPTだけで満足しちゃってませんか?
資料やソースコードの生成はもはや当たり前です。今やブラウザやGUIの操作までこなすAIツールが続々と登場中!その名も「自律型AIエージェント」です。こちらは下図のとおり、群雄割拠の状態で……
なかにはGitHubで160k以上のスターを集めた自律型AIエージェントも出てきています。
当記事では、そんな自律型AIエージェントのなかから、オープンソース・無料のものを18個厳選して紹介!完読いただくと、自分に合ったエージェントが見つかるかも……です。
ぜひ、最後までお読みくださいね。
コーディング用の自律型AIエージェント6選
まずはコーディング系のタスクにうってつけの自律型AIエージェントを紹介!今回は……
- Open Interpreter
- GPT Engineer
- Vanna.AI
- ReactAgent
- WorkGPT
- OpenHands
の6つをピックアップしております。※1
まずは、迷ったらとりあえず選びたい「Open Interpreter」から詳しくみていきましょう!
ローカルでも動く万能選手「Open Interpreter」
「Open Interpreter」は、まさしく万能選手な自律型AIエージェント。生成AI(GPT-4V / Llama 2 / DALL-E 3…etc.)との組み合わせで……
- データ解析
- ブラウザ制御
- PDFの生成・編集
- 動画の生成・編集
- 画像の生成・編集
- GUIからのPC操作
などなどが、プロンプトからできちゃいます。
さらにこのOpen Interpreterには、すごいところがあって……
● ローカル環境上で動作してくれる
● コード実行前にユーザーへの確認を挟んでくれる
という、気の利いた機能まで付いているんです。しかも誰でも無料で利用可。※2
みなさん、自律型AIエージェントで迷ったらとりあえず、Open Interpreterを使ってみてください!
公式サイト:Open Interpreter
コーディング全般におすすめの「GPT Engineer」
アプリ開発を生成AIに手伝ってもらいたいなら、「GPT Engineer」がおすすめ!こちらなら、以下のような処理が自動化できます。
- コードベース全体の生成
- コードベースの実行
- ソースコードの修正
- ソースコードの構成の指定
そんなGPT Engineerの魅力は、幅広いニーズを満たしてくれている点にあります。具体的には……
● プリプロンプトの入力で、任意の動作・プロジェクトの記憶が可能
● ChatGPT API / Azure Open AI APIで気軽に導入可能
● ローカルで動くオープンソースモデル(WizardCoder…etc.)にも対応
というふうに、プロジェクト・実行環境を選ばず動いてくれるんです。※3
公式サイト:GPT Engineer
高精度なSQL用エージェント「Vanna.AI」
SQLエンジニアのみなさん、こんなお悩みはありませんか?
「データベースの管理は、生成AIに任せられない……」
「だって、ハルシネーションがあるから……」
ですがもう大丈夫!以上をある程度克服した、SQL用自律型AIエージェント「Vanna.AI」が登場しました。
このVanna.AIのすごいところは……
● RAG搭載で、データベースの引用精度がUP
● ユーザーの処理をVanna.AI自体が学習、使えば使うほど精度がUP
といった点にあります。複雑なSQLでも、数秒で生成できちゃうんです!
しかもVanna.AIはSnowflake / BigQuery / Postgresなどなど、主流のデータベースに対応しています。データベース分野でも「生成AI時代」が始まりそうですね。※4
公式サイト:Vanna.AI
SaaSのUI作成なら「ReactAgent」
SaaSのUI部分を試作するなら、「ReactAgent」にお任せください!
このReactAgentは入力をヒントに、Reactコンポーネントを生成してくれる自律型AIエージェント。GPT-4の力で、自然言語とReactコンポーネントの入力に対応します。つまりは……
● ユーザーストーリーからの新規UI生成
● 既存コンポーネントの組み立て
● デザインシステムとの協働
などなどが、できちゃうわけです!※5
APIの呼び出しを自動化「WorkGPT」
「WorkGPT」はAPIの呼び出しに特化した自律型AIエージェント。そのすごいところは……
調べ物からランチの注文、画像生成までが手元で完結する
という点にあります。具体的には、動かしたいSaaSのAPIキーとプロンプトをWorkGPTに渡すだけで……
- Google Chrome
- Uber Eats
- OpenAIの各AIモデル
…etc.
と自動で連携、操作までこなしてくれちゃうんです!
参考:GitHub – team-openpm/workgpt: A GPT agent framework for invoking APIs
人間の開発者ができることはすべてできる「OpenHands」
OpenHands(旧OpenDevin) は、AIスタートアップ企業のCognitionが開発した自律型AIエージェントです。コーディングに特化しているのが特徴で、以下の作業を自律的に実行できます。
- コードの変更
- コマンドの実行
- Webの閲覧
- APIの呼び出し
上記のとおり、基本的には人間の開発者ができる作業を一通り任せられます。うまく使いこなせればソフトウェア開発を大幅に効率化できるので、ぜひ利用してみてください。
なお、OpenHands(旧 OpenDevin)について詳しく知りたい方は、下記の記事を合わせてご確認ください。
多目的な自律型AIエージェント4選
続いては、多目的に使える自律型AIエージェントをお届けします。今回紹介するのは……
- AutoGPT
- BabyAGI
- Camel
- Twitter Personalitye
の4つ!それぞれ、自力で手順まで考えてくれる優れものです。まずはGitHubでスター160kを達成した「AutoGPT」から、みていきましょう!
自力で手順まで考える大人気の「AutoGPT」
Powerd by GPT-4の「AutoGPT」は、GitHubで160k以上のスターを集めた自律型AIエージェントです。その人気の秘訣は……
● 与えた「名前 / 役割 / ゴール」をもとに、自力で手順を考えて実行
● ひな形「Forge」を使えば、AIエージェントの動作が指定可
● ブラウジングやメモリ管理の機能も完備
以上のとおり、半自動であらゆるタスクをこなしてくれる点にあります。
AutoGPTで自動化できるタスクは、というと……
- Google検索
- Webサイトへのアクセス
- ファイルの読み取り&保存
- Pythonファイルの実行
などなどです。
これなら自分用のCopilotが作れちゃうかも。「PCは自作派!」という方はぜひ、AutoGPTで未来を先取りしちゃってください!
日本発の自律型AIエージェント「BabyAGI」
日本からも自律型AIエージェントが登場しています!それが、Yohei Nakajima氏の開発した「BabyAGI」です。
このBabyAGIを構成するのは、
- GPT-4:大規模言語モデル(LLM)
- Pinecone:ベクトルデータベース
- LangChain:LLMと他のツールを繋ぐフレームワーク
の3つの部品。うち、GPT-4がユーザーからの命令を実行します。そしてGPT-4の実行結果をPineconeが記憶、GPT-4にフィードバックすることで……
試行錯誤しながら自力でタスクを達成してくれる!
ようになっているんです。
一人二役でタスクにあたる「Camel」
「Camel」は、生成AIに付きものの壁打ちを省いてくれる自律型AIエージェントです。そのすごいところは、というと……
LLM1台で2役として振る舞い、対話しながら複雑なタスクを遂行する
点にあります!仕組みは他の自律型AIエージェントよりもシンプルなんです。
とはいえ、Camelだけで……
このように、ゲーム開発が自動化できちゃいます。シンプルイズベスト、ということですね。
ちなみにCamelではGPTシリーズのほか、オープンソースのLLMも利用可。ローカルでも、自動化は止まりません!※6
公式サイト:CAMEL-AI
ツイート分析ができる「Twitter Personalitye」
Twitter Personalityeは、WordPressが開発した自律型AIエージェントで、Twitterアカウントのツイート分析ができます。Twitterのアカウント名を入力するだけで、指定したアカウントをオンラインで見つけて、大規模言語モデルで性格を分析する仕組みです。
軽いジョーク混じりの批評を提供してくれるので、X(旧Twitter)で一時的なトレンドにもなりました。
自分の性格はもちろん、ほかの方の性格を分析するのにも便利なため、ぜひ一度使ってみてください。
公式サイト:https://twitter.wordware.ai/
生産性が上がる自律型AIエージェント4選
ここからは、ローカル環境で業務の生産性を高めてくれる……
- Self-Operating Computer
- Local GPT
- Allice
- Lindy
以上4種の自律型AIエージェントを紹介します。GUI操作を自動化してくれる「Self-Operating Computer」からご覧あれ!
GUIが操作できる「Self-Operating Computer」
「Self-Operating Computer」はなんと、マウス&キーボードの操作を自動化してくれるmacOS専用の自律型AIエージェントです!その仕組みは……
マルチモーダルLLMの力で、カーソル・UIの位置を正確に把握する
というものになっています。これならMacBookやiMacでも、Copilotの助けが借りられますね。
ちなみにSelf-Operating Computerで選べるマルチモーダルLLMは、
- GPT-4V:ChatGPT API経由で動作
- Gemini Pro Vision:Gemini Pro API経由で動作
- LLaVa:ローカル環境で動作
の3種類です!※7
公式サイト:Self-Operating Computer | HyperWrite AI Agent
ローカル版AIチャット「Local GPT」
「Local GPT」はその名のとおり、
ローカル環境で完結する自律型AIエージェント
です!このLocal GPTは、Vicuna-7B等の小型LLMと組み合わせることで……
- ChatGPTライクな対話
- RAGによるデータの引用機能
をローカル環境上に再現してくれるすぐれもの。もちろん、利用料金は無料です。
さすがに精度は本家ChatGPTに及びませんが、「一家に一台、生成AI」が実現しちゃいます!
LLMの選択肢が魅力の「Allice」
「Allice」はリサーチからコーディングまで、仕事を選ばない自律型AIエージェントです。そのアピールポイントとしては……
● GPT-4からオープンソースまで、幅広いLLMが使える
● マルチモーダルLLMにも対応している
● タスクに応じたエージェントが作れる
● 複数のエージェントを連携させてタスクを実行してくれる
● 音声による入出力に対応している
などが挙げられます。
ちなみに2025年1月時点のAlliceで使えるLLMは、というと……
- claude-3-5-sonnet
- gpt-4-turbo/gpt-3.5-turbo
- gpt-4o
- meta-llama-3.1-70B-Instruct
- Qwen/Qwen2-72B-Instruct
- meta-llama-3.1-405B-Instruct
- openrouter
- groq:llama3-70b-8192
…etc.
です。開発途中であるため詳細は不明ですが、複雑なタスクがこなせちゃうかも!
参考:GitHub – myshell-ai/AIlice: A lightweight AI Agent
外部ツールと連携してタスクを自動化する「Lindy」
Lindyは、メールのやり取りなどの日常的なタスクを効率化してくれる自律型AIエージェントです。GmailやSlackなどの外部アプリと接続することで、メッセージのやり取りを自動化できます。
会議レコーダー機能も搭載しているので、議事録の作成や会議内容への回答も可能です。営業やカスタマーサポートといった幅広い職種のタスクをこなせるので、ぜひ利用してみてください。
公式サイト:https://www.lindy.ai/
なお、Self-Operating Computerについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
カスタマイズできる自律型AIエージェント4選
最後に、タスクに応じてカスタマイズができる自律型AIエージェントをみていきます。今回は、以下の4つをピックアップしました。
- AutoGen
- ChatDev
- CrewAI
- AgentGPT
まずはファインチューニングまで行える「AutoGen」から、概要をみていきましょう!
ファインチューニングも行える「AutoGen」
「AutoGen」は複数のエージェントを協働させるタイプの自律型AIエージェント。AIエージェント同士の対話を通して、
- コードの生成・実行・デバッグ
- 株価のプロット
といった複雑なタスクを完遂してくれます。
そしてもう一つ、AutoGenには独自のアピールポイントがあります。それは……
OpenAI製LLM(GPT-3.5)のファインチューニングができる
という点です。うまく使えば、自社業務特化型のAIエージェントが作れちゃうかもしれませんね。
参考:AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation
AI従業員を抱えるバーチャル企業「ChatDev」
ChatGPT API採用の「ChatDev」は、個性派の自律型AIエージェントです。「ソフトウェア開発を手がけるバーチャルIT企業」をコンセプトとしており……
● 「従業員」こと、複数のAIエージェントが協力してタスクにあたる
→CEO / CPO / CTO / プログラマー / レビュアー / テスター / アートデザイナー…etc.
● 設計 / コーディング / テスト / 資料作成の順に「ウォーターフォール型」でタスクを進める
● 従業員や工程のカスタマイズができる
という仕様になっています。
専門家を集めてタスクを解決「CrewAI」
「CrewAI」も複数のエージェントを協働させるタイプの自律型AIエージェントです。こちらでは各エージェントが……
- 研究者
- ライター
- プランナー
などの「専門家」のように振る舞いながら、タスクを解決します。ちなみに目的 / ツール / 各専門家の役割については、カスタマイズが可能です。
そんなCrewAIの気になる対応モデルは、ChatGPT API&各種オープンソースLLM!つまりローカルでも、文殊の知恵が借りられちゃうわけです。
以上、CrewAIを一言で表すと……
LLMの創造性を引き出してくれる自律型AIエージェント
といえます。ブレスト・案出しにお役立てください。※8
公式サイト:Crew AI
Webベースでカスタマイズが完結する「AgentGPT」
AgentGPTは、手軽に自律型AIエージェントを作れるAIプラットフォームです。作り方は簡単で、目的に合った名前や機能を入力するだけで、Webベースで自律型AIエージェントの作成・カスタマイズが完結します。
モデルにはOpenAIのGPT-3.5-Turboが組み込まれており、有料プランならGPT-4へのアクセスもできます。
自然言語の理解力が高いため、ユーザーの意図を正確に読み取り、目的に適した自律型AIエージェントを作成できるのが魅力です。
公式サイト:https://agentgpt.reworkd.ai/ja
なお、AutoGenについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
雑務は自律型AIエージェントにおまかせ
当記事では、WEELが厳選した自律型AIエージェントを18個を紹介しました。以下でもう一度、ジャンル別におすすめの自律型AIエージェントを振り返っていきましょう!
【コーディング用】
● Open Interpreter
● GPT Engineer
● Vanna.AI
● ReactAgent
● WorkGPT
OpenHands
【多目的】
● AutoGPT
● BabyAGI
● Camel
Twitter Personalitye
【生産性UP】
● Self-Operating Computer
● Local GPT
● Allice
Lindy
【カスタマイズ向け】
● AutoGen
● ChatDev
● CrewAI
AgentGPT
生成AI(LLM)1モデルで、資料作成 / コーディング / 案出し…etc.が自動化できちゃいます。そんな生成AIを、ChatGPTやGeminiのサービス内でしか使わないのはもったいない!
みなさんもぜひ、自律型AIエージェントでデスクトップに生成AIを召喚してみてくださいね。
- ※1:GitHub – e2b-dev/awesome-ai-agents: A list of AI autonomous agents
- ※2:GitHub – OpenInterpreter/open-interpreter: A natural language interface for computers
- ※3:GitHub – gpt-engineer-org/gpt-engineer: Specify what you want it to build, the AI asks for clarification, and then builds it.
- ※4:GitHub – vanna-ai/vanna: 🤖 Chat with your SQL database 📊. Accurate Text-to-SQL Generation via LLMs using RAG 🔄.
- ※5:GitHub – eylonmiz/react-agent: The open-source React.js Autonomous LLM Agent
- ※6:Communicative Agents for “Mind” Exploration of Large Language Model Society (NeruIPS’2023) https://www.camel-ai.org
- ※7:GitHub – OthersideAI/self-operating-computer: A framework to enable multimodal models to operate a computer.
- ※8:Framework for orchestrating role-playing, autonomous AI agents. By fostering collaborative intelligence, CrewAI empowers agents to work together seamlessly, tackling complex tasks.
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
自律型AIエージェントの活用が進む中で、業務効率化やタスクの自動化を実現できるツールは急速に広がっています。これらのエージェントが貴社のプロダクトや業務にどう活用できるか、ぜひ専門家と一緒に検討してみてください。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。