【タイムライン】AGI終末時計

AGI終末時計

タイムライン

Doomsday Clock – Timeline

現在のAIビックテックのAGI到達レベル

AGIパラメータ

– 2024年10月3日更新 –

AIビックテックのAGI到達レベルの変遷

AGI変遷

変更理由

日本時間2024年10月3日、ChatGPTの新機能「Canvas」が公開された。 生成した文章・ソースコードの気になる箇所を指定してピンポイントで修正ができる GPT-4oでは素のモデルよりも、コメントの正確性が30%、質が16%向上した。

– 2024年9月25日更新 –

AIビックテックのAGI到達レベルの変遷

AGI変遷

変更理由

Advanced Voice Mode」がChatGPT アプリPlusとTeamユーザーに公開された。 日本語を含む50以上の言語に対応しており、自然な音声会話が可能。 9種類の音声から選択でき、口調やアクセントの記憶までできるようになった。 その精度の良さに全世界のユーザーが驚いた。49→52に変更。

2024年9月24日Geminiの最新版「Gemini-1.5-Pro-002 / Gemini-1.5-Flash-002」が公開。 GPT-4oと比較したところ、理数科目のタスクに対してはそこまで良い結果が得られなかった。 しかし、要約タスクでは、順番を変更したり、複数の表を使ることで読みやすい回答を得られた。よって、42→43に更新した。

– 2024年9月12日更新 –

AIビックテックのAGI到達レベルの変遷

AGI変遷

変更理由

日本時間2024年9月12日、OpenAI o1-previewを公開。 このモデルは回答する前に考えるように設計され、より複雑なタスクに対しても回答が可能になった。 特に物理学、化学、生物学、数学での高いベンチマークで評価されている。しかし、回数制限があることを踏まえ、48→49に変更。

同日にGoogleが、ハルシネーション(幻覚)を抑えたモデル「DataGemma」を公開。 実際に使ってみた結果、間違った情報を出力することはなかったが、求めていた情報を完全に出力することができなかったため、大幅な変更はなく、41→42。

– 2024年8月29日更新 –

AIビックテックのAGI到達レベルの変遷

AlibabaのAGI変遷

変更理由

Qwen2-VLは、アリババクラウドが発表した最新の視覚言語モデルであり、優れた視覚理解能力を持っているとのこと。

弊社で検証してみた結果、確かに忠実に画像を認識し、解説できることがわかった。動画の解析もできるということで、33に設定。

– 2024年8月13日更新 –

AIビックテックのAGI到達レベルの変遷

xAIのAGI変遷

– 2024年7月18日更新 –

AIビックテックのAGI到達レベルの変遷

OoenAIのAGI変遷

– 2024年5月14日更新 –

AIビックテックのAGI到達レベルの変遷

GoogleのAGI変遷

– 2024年5月13日更新 –

AIビックテックのAGI到達レベルの変遷

OpenAIのAGI変遷

– 2024年4月23日更新 –

AIビックテックのAGI到達レベルの変遷

MicrosoftのAGI変遷

– 2024年4月5日更新 –

AIビックテックのAGI到達レベルの変遷

AnthropicのAGI変遷

– 2024年3月4日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

日本時間2024年3月4日、AnthropicがClaude 3を公開。公式の発表によると、全ベンチマークでGPT-4を超えるLLMであるとのこと。

弊社で検証してみた結果、確かにGPT-4に匹敵かそれ以上の性能を出していることがわかった。
しかし、ChatGPTは、性能が良い上に、GPTsやCode Interpreterなどの機能があり、総合的に判断するとChatGPTの方が優れているため、42に設定。

– 2024年2月20日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

2024年2月15日、OpenAIが動画生成AI「Sora」を公開。世界中に激震が走った。
Soraは、ユーザーがプロンプトで何を要求したかだけでなく、それらのものが物理世界にどのように存在するのかも理解し、もはや本物と見分けがつかないレベルの動画生成が可能。
公式文書では、Soraは「AGI達成への重大なマイルストーンである」と述べられており、AIの技術革新を大きく推し進めた。

(参考:https://openai.com/sora#research

– 2024年2月13日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

日本時間2024年2月8日 、GoogleがGemini Ultra 1.0を発表。Googleの発表によると、OpenAIのGPT-4を超えるとのこと。
弊社で検証してみた結果、GPT-4の方が優れていると感じた。加えて、Googleのレポートが示すよりもGemini UltraとGPT-4の差は大きいと考えた。
これは、Gemini Ultraの性能が低いのではなく、GPT-4が非公表のマイクロアップデートを経て、性能が上がっていると思う。
そのため、今回はGoogleのスコアは変わらず、OpenAIのスコアを38に引き上げた。

– 2024年2月7日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

Alibabaの数値を23%から30%に変更した。

日本時間2024年2月4日、AlibabaがQwen-1.5を発表。今回のQwen-1.5は、2023年に発表されていたQwenの強化版。

公式のレポートによると、Claude-2.1、GPT-3.5-Turbo-0613を上回り、GPT-4に迫る性能。その状況を見て、AlibabaのAGI到達レベルを30に引き上げた。

※我々の検証によって、到達レベルを変更する可能性あり。(https://qwenlm.github.io/blog/qwen1.5/

AGI終末時計について

終末時計が、世界の平和を祈る注意喚起であるように、
AGI終末時計も、AIによる支配を目指すものではありません。

むしろ日本らしいロボットアニメやドラえもんのような、
AIとの共創カルチャーを目指し、
子どもたちがAI-Nativeな時代で楽しく過ごせるように。

私たち大人が「未来に追いつく指標作り」をヴィジョンとして運営していきます。

このAGI終末時計は、皆様からのご意見を元に客観的な視点をもって随時更新されていくことを前提としています。
AGI度数やAGIレベル、そしてそれぞれの数値について皆さんのご意見や批判を受け付けております。
ご意見がある際はX(Twitter)にて #AGI終末時計 とつけてポストしてください。
弊社で確認させていただきます。

【運営元のWEELについて】

運営元のWEELについて

WEELはただの情報発信ではなく、未来予測をする拠点としてメディアを位置付けてきました。

活動は多岐にわたり、

  • OpenAIやGAFAMの生成AI競争の記事化
  • 次のトレンドを予測して、GitHubで生成AIのOSSをレビュー
  • HuggingFaceから面白いLLMを記事化
  • お客様のPC操作を模倣する自律型AIの開発

etc…

これまでの活動で得たノウハウ、最新情報、

そして皆様からのフォードバックとお便りをもって

AGI終末時計を更新し続け、現在のAIの進歩を可視化することで

AGIの到来にどこまで近づいているかお伝えします。