【タイムライン #1(2024/01/01 – 2024/12/31)】AGI終末時計

AGI終末時計

タイムライン

Doomsday Clock – Timeline

#1 (2024/02/06 – 2024/12/31)

2024年12月31日のAIビックテックのAGI到達レベル

AIビックテックのAGI到達レベル変遷

[table id=8 /]

– 2024年12月23日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

OpenAI
2024年12月16日、ChatGPT searchが無料プランでも使用可能に。Advanced Voice Modeにも対応し、音声会話での検索ができるように。スマホアプリ版にも地図機能が実装、地元のレストランや施設もできる。

2024年12月17日、API版のOpenAI o1が新機能とともにTier 5以上の開発者向け限定でリリース。
Advanced Voice ModeのAPI版、Realtime APIがアップデート。さらに新手法「Preference Fine-Tuning（選考性ファインチューニング）」が登場。

2024年12月18日、ChatGPT用の電話番号「1-800-ChatGPT（1-800-242-8478）」が登場。
米国限定だが、アカウント&利用料なしで、毎月15分まで通話可能。WhatsAppによるメッセージのやり取りにも対応。

2024年12月19日、macOSアプリ版ChatGPTが大幅アップデート。連携できるコーディングアプリが追加され、連携できるノートアプリも追加。2025年明けからは、Windowアプリや無料版でもリリース予定。

2024年12月20日、史上最もAGI（汎用人工知能）に近いLLM「OpenAI o3 / o3-mini」が登場。
o3は「ARC-AGI」を史上初めてクリアし、AGIに一歩近づいたとのこと。67→72に変更。

Google

Googleが2024年12月20日に「Gemini 2.0 Flash Thinking」を公開。
ライバルであるOpenAI o1の推論トークンと似た技術で「回答毎に思考過程を繰り返し生成して結論に至る」という仕組み。実際に検証したところ、o1の方が優れているという結果になったが、生成スピードはGemini 2.0 Flash Thinkingの方が上だった。61→64に変更。

– 2024年12月16日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

OpenAI
2024年12月5日、OpenAIが強化学習型ファインチューニングを発表。特定タスクへの特化に加え、正確性の向上も実現したそう。現在は研究・企業向けのみ募集している。

2024年12月9日、OpenAIがSoraを公開。今年の2月に発表されており、テキスト・画像・動画からの動画生成が直感的に行える。高品質な動画生成が可能。

2024年12月10日、ChatGPTユーザー全員全員がCanvas機能が利用できるように。 2024年10月に有料プランで先行公開された機能。 Canvasだけで文書作成やコーディングが完結させられるように。

2024年12月11日、Apple IntelligenceとChatGPTが連携。 Siriのように必要に応じてChatGPTが質問に回答してくれ、カメラとの連携やMac上での補助ができるように。

2024年12月12日、Advanced Voice Modeに、端末のカメラを使ったビデオ通話&画面共有の機能「Advanced voice with video」が追加。カメラや画面の内容をリアルタイムで共有できるように。

2024年12月13日にChatGPTでの作業を助ける新機能「プロジェクト（Projects）」が実装。チャット・ファイル・カスタム指示の一括管理ができる機能で、より便利に。

Google
Googleが2024年12月9日にリリースした最新の実験段階LLM「gemini-exp-1206」 200万トークン超のコンテキストウィンドウを持ち、マルチモーダルに機能を搭載。総合性能（Overall）で1位を獲得し、さまざまなタスクで高い性能を発揮。

Googleが2024年12月12日に「Gemini2.0 Flash」を公開。情報を処理するだけでなく、ユーザーのニーズや背景を理解し、その情報を基に「次に何が必要か」を考え、さらにその計画に従って行動できるモデルとして設計されている。

xAI
2024年12月9日にxAIのGrokから画像生成機能が公開。より人間のアイディアに沿った画像が生成でき、xのすべてのユーザーで利用可能に。20→23に変更。

2024年12月12日、Grok2がxのすべてのユーザーに公開。 8月にリリースしたものより3倍ほど高速で、精度の向上もされた。

Microsoft
2024年12月13日、MicrosoftからPhi-4が発表。 140億パラメータでありながらもGPT-4oと同等な性能を持つとされ、数学タスクではLLMをも凌駕するとのこと。

– 2024年12月5日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

2024年12月5日、OpenAIが「ChatGPT Pro」を公開。長く熟考する代わりに、理数科目や法律関連でより高度な問題解決能力を発揮する。従来のo1を差し置いて圧倒的なベンチマークを獲得。57→61に変更。

2024年12月4日にGoogleが「Genie2」を公開。テキストや画像から3D仮想世界を生成する基盤世界モデル。人やAI（エージェント）がキーボードやマウスを使って操作すると、その結果をシミュレーションして画面に反映できるように。 49→52に変更。

– 2024年11月28日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

2024年11月28日にQwenグループから「QwQ」が登場。 AI推論機能の進化に焦点を当てた、実験的研究モデルかつ未知の境界に深く向き合うことを目指したLLM。数学やプログラミングの分野で期待されているが、研究段階のモデル。36→37に変更。

2024年11月26日Anthropicから「Model Context Protocol」がリリース。 AIシステムがGoogle DriveやSlack、GitHub、Postgresなどの複数のデータやツールと共通の標準プロトコルで連携可能。サービス間の文脈を維持しながら効率的にデータを扱えるように。50→54に変更。

– 2024年11月15日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

2024年11月15日、Googleから新たなGeminiモデル「Gemini-exp-1114」が公開。ベンチマーク上ChatGPTを抑え、総合世界1位に。複雑で曖昧な指示や難しい質問にも的確に応答する能力を持ち、さらに数学的な計算や数式に基づく問題を正確に解く能力が優れているとのこと。 45→49に変更。

2024年11月12日、アリババクラウドが新たな大規模言語モデル「Qwen2.5-Coder」を公開。「Qwen2.5」のコードバージョンである「Qwen2.5-Coder」は、オープンソースで公開され、コードアシスタントやコード生成に活用可能。 GPT-4oのコーディング能力に匹敵する性能があるとして、35→36に変更。

2024年10月31日、OpenAIが検索エンジン機能「ChatGPT search」をChatGPTに実装。 GoogleやPerplexityといった外部の検索エンジンにアクセスしなくても、必要十分な情報が引用付きで得られるように。リアルタイム検索が可能となったことで利便性が向上。よって、54→57に変更。

2024年10月22日、イーロンマスクが率いるAI企業xAIがAPIを公開。 Grokモデルを使用するためのAPIであり、エンジニアや開発者はGrokの大規模言語モデルをもとにアプリケーションの開発が可能に。 17→20に変更。

– 2024年10月23日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

2024年10月23日にClaude 3.5 Sonnetの更新と、新しいClaude 3.5 Haikuを公開。さらに、computer useというAPI経由で動作するAIエージェントも発表。47→50に。
しかし、この機能はベータ版で、スクロールやドラッグが苦手で、スパムや詐欺への流用が懸念されている。

– 2024年10月10日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

2024年10月10日にGoogleが「Imagen3」を公開。人物の表情や服のしわ、風景の細かな質感など、より細部まで正確に再現できるように。また、テキストの描画能力も格段に向上。よって43→45に更新。

– 2024年10月3日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

日本時間2024年10月3日、ChatGPTの新機能「Canvas」が公開された。生成した文章・ソースコードの気になる箇所を指定してピンポイントで修正ができる GPT-4oでは素のモデルよりも、コメントの正確性が30％、質が16％向上した。

– 2024年9月25日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

「Advanced Voice Mode」がChatGPT アプリPlusとTeamユーザーに公開された。日本語を含む50以上の言語に対応しており、自然な音声会話が可能。 9種類の音声から選択でき、口調やアクセントの記憶までできるようになった。その精度の良さに全世界のユーザーが驚いた。49→52に変更。

2024年9月24日Geminiの最新版「Gemini-1.5-Pro-002 / Gemini-1.5-Flash-002」が公開。 GPT-4oと比較したところ、理数科目のタスクに対してはそこまで良い結果が得られなかった。しかし、要約タスクでは、順番を変更したり、複数の表を使ることで読みやすい回答を得られた。よって、42→43に更新した。

– 2024年9月12日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

日本時間2024年9月12日、OpenAI o1-previewを公開。このモデルは回答する前に考えるように設計され、より複雑なタスクに対しても回答が可能になった。特に物理学、化学、生物学、数学での高いベンチマークで評価されている。しかし、回数制限があることを踏まえ、48→49に変更。

同日にGoogleが、ハルシネーション（幻覚）を抑えたモデル「DataGemma」を公開。実際に使ってみた結果、間違った情報を出力することはなかったが、求めていた情報を完全に出力することができなかったため、大幅な変更はなく、41→42。

– 2024年8月29日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

Qwen2-VLは、アリババクラウドが発表した最新の視覚言語モデルであり、優れた視覚理解能力を持っているとのこと。

弊社で検証してみた結果、確かに忠実に画像を認識し、解説できることがわかった。動画の解析もできるということで、33に設定。

– 2024年8月13日更新 –

AIビックテックのAGI到達レベルの変遷

– 2024年7月18日更新 –

AIビックテックのAGI到達レベルの変遷

– 2024年5月14日更新 –

AIビックテックのAGI到達レベルの変遷

– 2024年5月13日更新 –

AIビックテックのAGI到達レベルの変遷

– 2024年4月23日更新 –

AIビックテックのAGI到達レベルの変遷

– 2024年4月5日更新 –

AIビックテックのAGI到達レベルの変遷

– 2024年3月4日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

日本時間2024年3月4日、AnthropicがClaude 3を公開。公式の発表によると、全ベンチマークでGPT-4を超えるLLMであるとのこと。

弊社で検証してみた結果、確かにGPT-4に匹敵かそれ以上の性能を出していることがわかった。
しかし、ChatGPTは、性能が良い上に、GPTsやCode Interpreterなどの機能があり、総合的に判断するとChatGPTの方が優れているため、42に設定。

– 2024年2月20日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

2024年2月15日、OpenAIが動画生成AI「Sora」を公開。世界中に激震が走った。
Soraは、ユーザーがプロンプトで何を要求したかだけでなく、それらのものが物理世界にどのように存在するのかも理解し、もはや本物と見分けがつかないレベルの動画生成が可能。
公式文書では、Soraは「AGI達成への重大なマイルストーンである」と述べられており、AIの技術革新を大きく推し進めた。

（参考：https://openai.com/sora#research）

– 2024年2月13日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

日本時間2024年2月8日、GoogleがGemini Ultra 1.0を発表。Googleの発表によると、OpenAIのGPT-4を超えるとのこと。
弊社で検証してみた結果、GPT-4の方が優れていると感じた。加えて、Googleのレポートが示すよりもGemini UltraとGPT-4の差は大きいと考えた。
これは、Gemini Ultraの性能が低いのではなく、GPT-4が非公表のマイクロアップデートを経て、性能が上がっていると思う。
そのため、今回はGoogleのスコアは変わらず、OpenAIのスコアを38に引き上げた。

– 2024年2月7日更新 –

AIビックテックのAGI到達レベルの変遷

変更理由

Alibabaの数値を23％から30%に変更した。

日本時間2024年2月4日、AlibabaがQwen-1.5を発表。今回のQwen-1.5は、2023年に発表されていたQwenの強化版。

公式のレポートによると、Claude-2.1、GPT-3.5-Turbo-0613を上回り、GPT-4に迫る性能。その状況を見て、AlibabaのAGI到達レベルを30に引き上げた。

※我々の検証によって、到達レベルを変更する可能性あり。（https://qwenlm.github.io/blog/qwen1.5/）

AGI終末時計について

終末時計が、世界の平和を祈る注意喚起であるように、
AGI終末時計も、AIによる支配を目指すものではありません。

むしろ日本らしいロボットアニメやドラえもんのような、
AIとの共創カルチャーを目指し、
子どもたちがAI-Nativeな時代で楽しく過ごせるように。

私たち大人が「未来に追いつく指標作り」をヴィジョンとして運営していきます。

このAGI終末時計は、皆様からのご意見を元に客観的な視点をもって随時更新されていくことを前提としています。
AGI度数やAGIレベル、そしてそれぞれの数値について皆さんのご意見や批判を受け付けております。
ご意見がある際はX（Twitter）にて #AGI終末時計とつけてポストしてください。
弊社で確認させていただきます。

#AGI終末時計をポスト

【運営元のWEELについて】

運営元のWEELについて

WEELはただの情報発信ではなく、未来予測をする拠点としてメディアを位置付けてきました。

活動は多岐にわたり、

OpenAIやGAFAMの生成AI競争の記事化
次のトレンドを予測して、GitHubで生成AIのOSSをレビュー
HuggingFaceから面白いLLMを記事化
お客様のPC操作を模倣する自律型AIの開発

etc…

これまでの活動で得たノウハウ、最新情報、

そして皆様からのフォードバックとお便りをもって

AGI終末時計を更新し続け、現在のAIの進歩を可視化することで

AGIの到来にどこまで近づいているかお伝えします。

#AGI終末時計をポスト

【タイムライン #1(2024/01/01 – 2024/12/31)】AGI終末時計

AGI終末時計