【JARVIS-1】マインクラフトを人間より上手にプレイできるAIが登場

JARVIS-1 マルチモーダルAI

3Dブロックで構成された仮想世界で自由に遊べる、大人・子ども問わず大人気のゲームであるマインクラフト。

このマインクラフト内でさまざまなタスクを実行できる、「JARVIS-1」というAIが中国で開発されたのをご存じでしょうか?

今回はJARVIS-1がどのような特徴を持つAIなのか、実際の研究データなどを用いながらわかりやすく解説します。

興味のある方は、ぜひ参考にしてください!

参考記事:Meet JARVIS-1: Open-World Multi-Task Agents with Memory-Augmented Multimodal Language Models

目次

JARVIS-1:マインクラフト内のタスクに特化したマルチモーダルAI

JARVIS-1とは、簡単に言うと【マインクラフト内のタスクに特化したマルチモーダルAI】です。

※マルチモーダルAIとは?
テキストや画像、動画など、複数種類の情報を処理できるAIのこと。
マルチモーダルAIを利用すると、画像からテキストを生成したり、テキストから動画を生成したりできる。

JARVIS-1は、人間の指示や視覚情報を適切に解釈できるため、高度なタスクでも問題なく実行できます。

実際JARVIS-1に200以上の多様なタスクを実行させたところ、ほぼすべてのタスクでカンペキに近いパフォーマンスを発揮したそうです。中でも「ダイヤモンドのつるはし」に関するタスクでは、従来のAIと比べて達成率が約5倍だったのだとか。

さらにJARVIS-1が優れている点は、「元々持っている知識+ゲーム内で経験・習得した情報」を基に思考・判断し、人間のように自らをアップデートできるという点。

JARVIS-1の研究・開発が進むことで、人間のように高度な思考・判断が可能なAIが将来的に実現できるのでは?と期待されています。

なお、マルチモーダルAIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
マルチモーダルAIとは?特徴やできること、代表例を解説

JARVIS-1は複雑なタスクでより高いパフォーマンスを発揮する

ここでJAVIS-1の性能がいかに優れているのか、JAVIS-1と他のAIのタスク処理能力を比較した研究結果を紹介します。

以下は、JARVIS-1と他4種類のAI(GPT/ReAct/Inner Monologue/DEPS)のタスク達成度を比較した結果です。

引用:https://arxiv.org/pdf/2311.05997.pdf

ご覧のとおり、すべてのタスクにおいてJARVIS-1が最も優れたパフォーマンスを発揮しています。

中でも特に「ダイヤモンドのつるはし」に関するタスク(赤枠で囲った部分)では、JARVIS-1は他のAIと比べ、達成率が約5倍にも及ぶことが見てとれますね。

さらに以下は、JARVIS-1とGPTのタスク達成度を図式化して比較した結果です。

引用:https://arxiv.org/pdf/2311.05997.pdf

  • 縦軸:タスクの達成率
  • 横軸:タスクの種類(STONE→IRON→DIAMONDの順にタスクが複雑になっている)

ここで、各タスクにおいてJARVIS-1がGPTと比べてタスク達成率が何倍なのか、実際に計算してみると、下記のようになります。

  • STONE:GPTの4.39倍
  • IRON:GPTの10.59倍
  • DIAMOND:GPTが0%のため計算不可

つまりJARVIS-1はGPTと比べて、タスクが複雑であればあるほど、より高いパフォーマンスを発揮するということがわかります。

JARVIS-1が従来のAIと比較して、いかに優れているかがお分かりいただけたでしょうか?

JARVIS-1が進化すればAGIも実現できるかもしれない!?

2023年現在の一般的なAI研究・開発では、膨大な量のデータを扱う必要があり、またAIをアップデートするために半永久的に学習させ続けなければなりません。

一方JARVIS-1の場合、「元々持っている知識+ゲーム内で経験・習得した情報」を基に思考・判断し、人間のように自らをアップデートできます。

これはまさしく、AGIの特徴なのです。

※AGI(汎用人工知能)とは?
人間と同様に、状況に応じた思考・判断ができるAIのこと。
AGIが実現すれば、顧客対応や医療現場でも活用できると言われている。

2023年11月現在、AGIはまだ実現しておらず、開発まであと数十年はかかるという説もあります。

しかしJARVIS-1を見てみると、あくまでマインクラフト内の世界に限定されるものの、AGIと同レベルの性能を持っています。

つまり、今後JARVIS-1の研究が進んで適用範囲がより広くなれば、そう遠くない将来AGIが実現するかもしれないのです!

マインクラフトがAGI発祥の舞台になるとは、一体誰が予想できたでしょうか?

なお、AGIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
AGI(汎用人工知能)とは?ANIやASIとの違いや何ができるのか、ビジネス事例を解説

まとめ

以下、JARVIS-1についてのまとめです。

従来のAIJARVIS-1
学習方法・膨大な量のデータが必要
・アップデートのために半永久的な学習が必要
・「元々持っている知識+ゲーム内で経験・習得した情報」を基に、自ら学習・アップデートできる
タスク処理能力・簡単なタスクならこなせるものの、複雑なタスクには対応できない・人間の指示や視覚情報を適切に解釈できるため、高度なタスクでも問題なく実行できる
タスクが複雑であればあるほど、より高いパフォーマンスを発揮する。
将来性・JARVIS-1と比べると薄い近い将来AGIが実現できる可能性もある

まさかマインクラフト用に開発されたAIが、AGI実現に向けた大きな一歩になっているとは驚きですよね…

今後はJARVIS-1の動向にも、しっかり注目していこうと思います!

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

最後に

いかがだったでしょうか?

弊社では

・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
ハルシネーション対策AIツールの開発
自社専用のAIチャットボットの開発

などの開発実績がございます。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
無料相談

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • たけし

    Webライター / メディア運営 フリーランスのWebライターとして活動。 これまでさまざまなAIツールを使ってきた経験を基に、AI技術の最新情報や使用方法に関する記事を執筆。 また、個人でもメディアを運営中。

  • URLをコピーしました!
  • URLをコピーしました!
目次