自律型AIエージェントまとめ!厳選したおすすめAIツール14選
WEELメディア事業部AIライターの2scです。
みなさん、ChatGPTだけで満足しちゃってませんか?
資料やソースコードの生成はもはや当たり前です。今やブラウザやGUIの操作までこなすAIツールが続々と登場中!その名も「自律型AIエージェント」です。こちらは下図のとおり、群雄割拠の状態で……
なかにはGitHubで160k以上のスターを集めた自律型AIエージェントも出てきています。
当記事では、そんな自律型AIエージェントのなかから、オープンソース・無料のものを14個厳選して紹介!完読いただくと、自分に合ったエージェントが見つかるかも……です。
ぜひ、最後までお読みくださいね。
コーディング用の自律型AIエージェント5選
まずはコーディング系のタスクにうってつけの自律型AIエージェントを紹介!今回は……
- Open Interpreter
- GPT Engineer
- Vanna.AI
- ReactAgent
- WorkGPT
の5つをピックアップしております。※1
まずは、迷ったらとりあえず選びたい「Open Interpreter」から詳しくみていきましょう!
ローカルでも動く万能選手「Open Interpreter」
「Open Interpreter」は、まさしく万能選手な自律型AIエージェント。生成AI(GPT-4V / Llama 2 / DALL-E 3…etc.)との組み合わせで……
- データ解析
- ブラウザ制御
- PDFの生成・編集
- 動画の生成・編集
- 画像の生成・編集
- GUIからのPC操作
などなどが、プロンプトからできちゃいます。
さらにこのOpen Interpreterには、すごいところがあって……
● ローカル環境上で動作してくれる
● コード実行前にユーザーへの確認を挟んでくれる
という、気の利いた機能まで付いているんです。しかも誰でも無料で利用可。※2
みなさん、自律型AIエージェントで迷ったらとりあえず、Open Interpreterを使ってみてください!
公式サイト:Open Interpreter
コーディング全般におすすめの「GPT Engineer」
アプリ開発を生成AIに手伝ってもらいたいなら、「GPT Engineer」がおすすめ!こちらなら、以下のような処理が自動化できます。
- コードベース全体の生成
- コードベースの実行
- ソースコードの修正
- ソースコードの構成の指定
そんなGPT Engineerの魅力は、幅広いニーズを満たしてくれている点にあります。具体的には……
● プリプロンプトの入力で、任意の動作・プロジェクトの記憶が可能
● ChatGPT API / Azure Open AI APIで気軽に導入可能
● ローカルで動くオープンソースモデル(WizardCoder…etc.)にも対応
というふうに、プロジェクト・実行環境を選ばず動いてくれるんです。※3
公式サイト:GPT Engineer
高精度なSQL用エージェント「Vanna.AI」
SQLエンジニアのみなさん、こんなお悩みはありませんか?
「データベースの管理は、生成AIに任せられない……」
「だって、ハルシネーションがあるから……」
ですがもう大丈夫!以上をある程度克服した、SQL用自律型AIエージェント「Vanna.AI」が登場しました。
このVanna.AIのすごいところは……
● RAG搭載で、データベースの引用精度がUP
● ユーザーの処理をVanna.AI自体が学習、使えば使うほど精度がUP
といった点にあります。複雑なSQLでも、数秒で生成できちゃうんです!
しかもVanna.AIはSnowflake / BigQuery / Postgresなどなど、主流のデータベースに対応しています。データベース分野でも「生成AI時代」が始まりそうですね。※4
公式サイト:Vanna.AI
SaaSのUI作成なら「ReactAgent」
SaaSのUI部分を試作するなら、「ReactAgent」にお任せください!
このReactAgentは入力をヒントに、Reactコンポーネントを生成してくれる自律型AIエージェント。GPT-4の力で、自然言語とReactコンポーネントの入力に対応します。つまりは……
● ユーザーストーリーからの新規UI生成
● 既存コンポーネントの組み立て
● デザインシステムとの協働
などなどが、できちゃうわけです!※5
APIの呼び出しを自動化「WorkGPT」
「WorkGPT」はAPIの呼び出しに特化した自律型AIエージェント。そのすごいところは……
調べ物からランチの注文、画像生成までが手元で完結する
という点にあります。具体的には、動かしたいSaaSのAPIキーとプロンプトをWorkGPTに渡すだけで……
- Google Chrome
- Uber Eats
- OpenAIの各AIモデル
…etc.
と自動で連携、操作までこなしてくれちゃうんです!
参考:GitHub – team-openpm/workgpt: A GPT agent framework for invoking APIs
なお、Open Interpreterについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→Open Interpreterがついに画像出力にも対応!使い方から実践までを解説【画像付き】
多目的な自律型AIエージェント3選
続いては、多目的に使える自律型AIエージェントをお届けします。今回紹介するのは……
- AutoGPT
- BabyAGI
- Camel
の3つ!それぞれ、自力で手順まで考えてくれる優れものです。まずはGitHubでスター160kを達成した「AutoGPT」から、みていきましょう!
自力で手順まで考える大人気の「AutoGPT」
Powerd by GPT-4の「AutoGPT」は、GitHubで160k以上のスターを集めた自律型AIエージェントです。その人気の秘訣は……
● 与えた「名前 / 役割 / ゴール」をもとに、自力で手順を考えて実行
● ひな形「Forge」を使えば、AIエージェントの動作が指定可
● ブラウジングやメモリ管理の機能も完備
以上のとおり、半自動であらゆるタスクをこなしてくれる点にあります。
AutoGPTで自動化できるタスクは、というと……
- Google検索
- Webサイトへのアクセス
- ファイルの読み取り&保存
- Pythonファイルの実行
などなどです。
これなら自分用のCopilotが作れちゃうかも。「PCは自作派!」という方はぜひ、AutoGPTで未来を先取りしちゃってください!
日本発の自律型AIエージェント「BabyAGI」
日本からも自律型AIエージェントが登場しています!それが、Yohei Nakajima氏の開発した「BabyAGI」です。
このBabyAGIを構成するのは、
- GPT-4:大規模言語モデル(LLM)
- Pinecone:ベクトルデータベース
- LangChain:LLMと他のツールを繋ぐフレームワーク
の3つの部品。うち、GPT-4がユーザーからの命令を実行します。そしてGPT-4の実行結果をPineconeが記憶、GPT-4にフィードバックすることで……
試行錯誤しながら自力でタスクを達成してくれる!
ようになっているんです。
一人二役でタスクにあたる「Camel」
「Camel」は、生成AIに付きものの壁打ちを省いてくれる自律型AIエージェントです。そのすごいところは、というと……
LLM1台で2役として振る舞い、対話しながら複雑なタスクを遂行する
点にあります!仕組みは他の自律型AIエージェントよりもシンプルなんです。
とはいえ、Camelだけで……
このように、ゲーム開発が自動化できちゃいます。シンプルイズベスト、ということですね。
ちなみにCamelではGPTシリーズのほか、オープンソースのLLMも利用可。ローカルでも、自動化は止まりません!※6
公式サイト:CAMEL-AI
生産性が上がる自律型AIエージェント3選
ここからは、ローカル環境で業務の生産性を高めてくれる……
- Self-Operating Computer
- Local GPT
- Allice
以上3種の自律型AIエージェントを紹介します。GUI操作を自動化してくれる「Self-Operating Computer」からご覧あれ!
GUIが操作できる「Self-Operating Computer」
「Self-Operating Computer」はなんと、マウス&キーボードの操作を自動化してくれるmacOS専用の自律型AIエージェントです!その仕組みは……
マルチモーダルLLMの力で、カーソル・UIの位置を正確に把握する
というものになっています。これならMacBookやiMacでも、Copilotの助けが借りられますね。
ちなみにSelf-Operating Computerで選べるマルチモーダルLLMは、
- GPT-4V:ChatGPT API経由で動作
- Gemini Pro Vision:Gemini Pro API経由で動作
- LLaVa:ローカル環境で動作
の3種類です!※7
公式サイト:Self-Operating Computer | HyperWrite AI Agent
ローカル版AIチャット「Local GPT」
「Local GPT」はその名のとおり、
ローカル環境で完結する自律型AIエージェント
です!このLocal GPTは、Vicuna-7B等の小型LLMと組み合わせることで……
- ChatGPTライクな対話
- RAGによるデータの引用機能
をローカル環境上に再現してくれるすぐれもの。もちろん、利用料金は無料です。
さすがに精度は本家ChatGPTに及びませんが、「一家に一台、生成AI」が実現しちゃいます!
LLMの選択肢が魅力の「Allice」
「Allice」はリサーチからコーディングまで、仕事を選ばない自律型AIエージェントです。そのアピールポイントとしては……
● GPT-4からオープンソースまで、幅広いLLMが使える
● マルチモーダルLLMにも対応している
● タスクに応じたエージェントが作れる
● 複数のエージェントを連携させてタスクを実行してくれる
● 音声による入出力に対応している
などが挙げられます。
ちなみに2024年3月時点のAlliceで使えるLLMは、というと……
- GPT-4 Turbo
- GPT-4V
- MIstral Quantized 70B
- Nous Hermes 2 Vision
- Mistral 7B
- CodeLlama-34B-v2
- OpenChat-3.5
…etc.
です。開発途中であるため詳細は不明ですが、複雑なタスクがこなせちゃうかも!
参考:GitHub – myshell-ai/AIlice: A lightweight AI Agent
なお、Self-Operating Computerについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Self-Operating Computer】人間に代わってAIがPCを操る!使い方〜実践まで
カスタマイズできる自律型AIエージェント3選
最後に、タスクに応じてカスタマイズができる自律型AIエージェントをみていきます。今回は、以下の3つをピックアップしました。
- AutoGen
- ChatDev
- CrewAI
まずはファインチューニングまで行える「AutoGen」から、概要をみていきましょう!
ファインチューニングも行える「AutoGen」
「AutoGen」は複数のエージェントを協働させるタイプの自律型AIエージェント。AIエージェント同士の対話を通して、
- コードの生成・実行・デバッグ
- 株価のプロット
といった複雑なタスクを完遂してくれます。
そしてもう一つ、AutoGenには独自のアピールポイントがあります。それは……
OpenAI製LLM(GPT-3.5)のファインチューニングができる
という点です。うまく使えば、自社業務特化型のAIエージェントが作れちゃうかもしれませんね。
参考:AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation
AI従業員を抱えるバーチャル企業「ChatDev」
ChatGPT API採用の「ChatDev」は、個性派の自律型AIエージェントです。「ソフトウェア開発を手がけるバーチャルIT企業」をコンセプトとしており……
● 「従業員」こと、複数のAIエージェントが協力してタスクにあたる
→CEO / CPO / CTO / プログラマー / レビュアー / テスター / アートデザイナー…etc.
● 設計 / コーディング / テスト / 資料作成の順に「ウォーターフォール型」でタスクを進める
● 従業員や工程のカスタマイズができる
という仕様になっています。
専門家を集めてタスクを解決「CrewAI」
「CrewAI」も複数のエージェントを協働させるタイプの自律型AIエージェントです。こちらでは各エージェントが……
- 研究者
- ライター
- プランナー
などの「専門家」のように振る舞いながら、タスクを解決します。ちなみに目的 / ツール / 各専門家の役割については、カスタマイズが可能です。
そんなCrewAIの気になる対応モデルは、ChatGPT API&各種オープンソースLLM!つまりローカルでも、文殊の知恵が借りられちゃうわけです。
以上、CrewAIを一言で表すと……
LLMの創造性を引き出してくれる自律型AIエージェント
といえます。ブレスト・案出しにお役立てください。※8
公式サイト:Crew AI
なお、AutoGenについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【AutoGen】複数のAIエージェントが会話しながら複雑なタスクを自動解決してくれるツール
雑務は自律型AIエージェントにおまかせ
当記事では、WEELが厳選した自律型AIエージェントを14個を紹介しました。以下でもう一度、ジャンル別におすすめの自律型AIエージェントを振り返っていきましょう!
【コーディング用】
● Open Interpreter
● GPT Engineer
● Vanna.AI
● ReactAgent
● WorkGPT
【多目的】
● AutoGPT
● BabyAGI
● Camel
【生産性UP】
● Self-Operating Computer
● Local GPT
● Allice
【カスタマイズ向け】
● AutoGen
● ChatDev
● CrewAI
生成AI(LLM)1モデルで、資料作成 / コーディング / 案出し…etc.が自動化できちゃいます。そんな生成AIを、ChatGPTやGeminiのサービス内でしか使わないのはもったいない!
みなさんもぜひ、自律型AIエージェントでデスクトップに生成AIを召喚してみてくださいね。
- ※1:GitHub – e2b-dev/awesome-ai-agents: A list of AI autonomous agents
- ※2:GitHub – OpenInterpreter/open-interpreter: A natural language interface for computers
- ※3:GitHub – gpt-engineer-org/gpt-engineer: Specify what you want it to build, the AI asks for clarification, and then builds it.
- ※4:GitHub – vanna-ai/vanna: 🤖 Chat with your SQL database 📊. Accurate Text-to-SQL Generation via LLMs using RAG 🔄.
- ※5:GitHub – eylonmiz/react-agent: The open-source React.js Autonomous LLM Agent
- ※6:Communicative Agents for “Mind” Exploration of Large Language Model Society (NeruIPS’2023) https://www.camel-ai.org
- ※7:GitHub – OthersideAI/self-operating-computer: A framework to enable multimodal models to operate a computer.
- ※8:Framework for orchestrating role-playing, autonomous AI agents. By fostering collaborative intelligence, CrewAI empowers agents to work together seamlessly, tackling complex tasks.
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
WEELの生成AIへのスタンス
ChatGPTやStable Diffusionなど使い勝手の良いAIサービスは沢山あります。そういったもの1度使ってみて、もっとこうしたい、こう言った使い方をしたいと言った方に向けてカスタマイズを勧めております。
もし、自社で生成AIを活用したいという場合は
1. 汎用的な生成AIツールを導入し、定着させる
2. 業務を生成AIに解けるタスクまで分解し、自動化する
のどちらかが良いと思います。
弊社では
1の場合、生成AIセミナーの実施や生成AIコンサルティングなどで、AI専門家による生成AI活用指導
2の場合、PoC開発やソリューション開発などで、LLMエンジニアやAIコンサルタントが御社にあったAIツールの開発を行います。
無料相談にてご相談を承っておりますので、興味がある方は以下からご連絡ください。
→無料相談で話してみる
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。