【タイムライン #1(2024/01/01 – 2024/12/31)】AGI終末時計

AGI終末時計
タイムライン
Doomsday Clock – Timeline
#1 (2024/02/06 – 2024/12/31)
2024年12月31日のAIビックテックのAGI到達レベル

AIビックテックのAGI到達レベル変遷
更新日 | 概要 | |
---|---|---|
2024年12月20日 | 2024年12月19日、macOSアプリ版ChatGPTが大幅アップデート。 連携できるコーディングアプリが追加され、連携できるノートアプリも追加。 Advanced Voiceからの外部アプリ操作も実現。 2025年明けからは、Windowアプリや無料版でもリリース予定。 | 変遷 |
Googleが2024年12月20日に「Gemini 2.0 Flash Thinking」を公開。 ライバルであるOpenAI o1の推論トークンと似た技術で 「回答毎に思考過程を繰り返し生成して結論に至る」という仕組み。 実際に検証したところ、o1の方が優れているという結果になったが、 生成スピードはGemini 2.0 Flash Thinkingの方が上だった。 61→64に変更。 | 変遷 | |
2024年12月19日 | 2024年12月19日、macOSアプリ版ChatGPTが大幅アップデート。 連携できるコーディングアプリが追加され、連携できるノートアプリも追加。 Advanced Voiceからの外部アプリ操作も実現。 2025年明けからは、Windowアプリや無料版でもリリース予定。 | |
2024年12月18日 | 2024年12月18日、ChatGPT用の電話番号「1-800-ChatGPT(1-800-242-8478)」が登場。 米国限定だが、アカウント&利用料なしで、 毎月15分まで通話可能。 WhatsAppによるメッセージのやり取りにも対応。 | |
2024年12月17日 | 2024年12月17日、API版のOpenAI o1が新機能とともにTier 5以上の開発者向け限定でリリース。 Advanced Voice ModeのAPI版、Realtime APIがアップデート。 さらに新手法「Preference Fine-Tuning(選考性ファインチューニング)」が登場。 | |
2024年12月16日 | 2024年12月16日、ChatGPT search無料プランでも使用可能に。 Advanced Voice Modeにも対応し、音声会話での検索ができるように。 スマホアプリ版にも地図機能が実装、地元のレストランや施設もできる。 | |
2024年12月13日 | 2024年12月13日、MicrosoftからPhi-4が発表。 140億パラメータでありながらもGPT-4oと同等な性能を持つとされ、 数学タスクではLLMをも凌駕するとのこと。14→18へ。 | 変遷 |
2024年12月13日にChatGPTでの作業を助ける新機能「プロジェクト(Projects)」が実装。 チャット・ファイル・カスタム指示の一括管理ができる機能で、より便利に。66→67に変更。 | ||
2024年12月12日 | Googleが2024年12月12日に「Gemini2.0 Flash」を公開。 情報を処理するだけでなく、ユーザーのニーズや背景を理解し、 その情報を基に「次に何が必要か」を考え、 さらにその計画に従って行動できるモデルとして設計されている。 57→61に変更。 | 変遷 |
2024年12月12日、Advanced Voice Modeに、 端末のカメラを使ったビデオ通話&画面共有の機能「Advanced voice with video」が追加。 カメラや画面の内容をリアルタイムで共有できるように。64→66に変更。 | 変遷 | |
2024年12月12日、Grok2がxのすべてのユーザーに公開。 8月にリリースしたものより3倍ほど高速で、精度の向上もされた。23→24に。 | 変遷 | |
2024年12月11日 | 2024年12月11日、Apple IntelligenceとChatGPTが連携。 Siriのように必要に応じてChatGPTが質問に回答してくれ、 カメラとの連携やMac上での補助ができるように。 | 変遷 |
2024年12月10日 | 2024年12月10日、ChatGPTユーザー全員全員にCanvas機能が利用できるように。 2024年10月に有料プランで先行公開された機能。 Canvasだけで文書作成やコーディングが完結させられるように。 | |
2024年12月9日 | Googleが2024年12月9日にリリースした最新の実験段階LLM「gemini-exp-1206」 200万トークン超のコンテキストウィンドウを持ち、マルチモーダルに機能を搭載。 総合性能(Overall)で1位を獲得し、さまざまなタスクで高い性能を発揮。55→57に。 | 変遷 |
2024年12月9日にxAIのGrokから画像生成機能が公開。 より人間のアイディアに沿った画像が生成でき、xのすべてのユーザーで利用可能に。20→23に変更。 | 変遷 | |
2024年12月9日、OpenAIがSoraを公開。 今年の2月に発表されており、テキスト・画像・動画からの動画生成が直感的に行える。 高品質な動画生成が可能。 | 変遷 | |
2024年12月6日 | 2024年12月5日、OpenAIが強化学習型ファインチューニングを発表。 特定タスクへの特化に加え、正確性の向上も実現したそう。 現在は研究・企業向けのみ募集している。 | |
2024年12月5日 | 2024年12月5日、OpenAIが「ChatGPT Pro」を公開。 長く熟考する代わりに、理数科目や法律関連でより高度な問題解決能力を発揮する。 従来のo1を差し置いて圧倒的なベンチマークを獲得。57→61に変更。 | 変遷 |
2024年12月4日 | 2024年12月4日にGoogleが「Genie2」を公開。 テキストや画像から3D仮想世界を生成する基盤世界モデル。 人やAIがキーボードやマウスを使って操作すると、 その結果をシミュレーションして画面に反映できるように。49→52に変更。 | 変遷 |
2024年11月28日 | 2024年11月28日にQwenグループから「QwQ」が登場。 数学やプログラミングの分野で期待されているが、研究段階のモデル。36→37に変更。 | 変遷 |
2024年11月26日 | 2024年11月26日Anthropicから「Model Context Protocol」がリリース。 サービス間の文脈を維持しながら効率的にデータを扱えるように。50→54に変更。 | 変遷 |
2024年11月15日 | Googleから新たなGeminiモデル「Gemini-exp-1114」が公開。 ベンチマーク上ChatGPTを抑え、総合世界1位に。 45→49に変更。 | 変遷 |
2024年11月12日 | アリババクラウドが新たな大規模言語モデル「Qwen2.5-Coder」を公開。 GPT-4oのコーディング能力に匹敵する性能があるとして、35→36に変更。 | 変遷 |
2024年10月31日 | OpenAIが検索エンジン機能「ChatGPT search」をChatGPTに実装。 GoogleやPerplexityといった外部の検索エンジンにアクセスしなくても、 必要十分な情報が引用付きで得られるように。 よって、54→57に変更。 | 変遷 |
2024年10月23日 | 2024年10月23日に Claude 3.5 Sonnetの更新と、新しいClaude 3.5 Haikuを公開。 さらに、computer useというAPI経由で動作するAIエージェントも発表。47→50に。 しかし、この機能はベータ版で、スクロールやドラッグが苦手で、 スパムや詐欺への流用が懸念されている。 | 変遷 |
2024年10月22日 | 2024年10月22日、イーロンマスクが率いるAI企業xAIがAPIを公開。 Grokモデルを使用するためのAPIであり、エンジニアや開発者は Grokの大規模言語モデルをもとに開発が可能に。 17→20に変更。 | 変遷 |
2024年10月10日 | 日本時間2024年10月10日にGoogleが「Imagen3」を公開。 人物の表情や服のしわ、風景の細かな質感など、より細部まで正確に再現できるように。 また、テキストの描画能力も格段に向上。よって43→45に更新。 | 変遷 |
2024年10月3日 | 日本時間2024年10月3日、ChatGPTの新機能「Canvas」が公開された。 生成した文章・ソースコードの気になる箇所を指定してピンポイントで修正が可能に。 GPT-4oでは素のモデルよりも、コメントの正確性が30%、質が16%向上した。52→54に変更。 | 変遷 |
2024年9月25日 | 「Advanced Voice Mode」がChatGPT アプリPlusとTeamユーザーに公開された。 日本語を含む50以上の言語に対応しており、自然な音声会話が可能。 9種類の音声から選択でき、口調やアクセントの記憶までできるようになった。 その精度の良さに全世界のユーザーが驚いた。49→52に変更。 | 変遷 |
2024年9月24日 | Geminiの最新版「Gemini-1.5-Pro-002 / Gemini-1.5-Flash-002」が公開。 GPT-4oと比較したところ、 理数科目のタスクに対してはそこまで良い結果が得られなかった。 しかし、要約タスクでは、 順番を変更したり、複数の表を使うことで読みやすい回答を得られた。よって、42→43に更新した。 | 変遷 |
2024年9月12日 | ハルシネーション(幻覚)を抑えたモデル「DataGemma」を公開。 実際に使ってみた結果、間違った情報を出力することはなかったが、 求めていた情報を完全に出力することができなかったため、大幅な更新はなく、41→42。 | 変遷 |
2024年9月12日 | 日本時間2024年9月12日、OpenAI o1-previewを公開。 このモデルは回答する前に考えるように設計され、 より複雑なタスクに対しても回答が可能になった。 特に物理学、化学、生物学、数学での高いベンチマークで評価されている。 しかし、回数制限があることを踏まえ、48→49に変更。 | 変遷 |
2024年9月9日 | Qwenグループが「Qwen2.5」モデルを13個同時にリリース。 特にコーディングや数学の分野で顕著な性能向上を実現。33→35に変更。 | |
2024年8月29日 | AlibabaのQwenグループが「Qwen2-VL」を公開。 複雑なオブジェクトの関係性や多言語のテキストを認識する能力に優れており、 長時間の動画の理解も可能に。30→33に変更。 | 変遷 |
2024年8月20日 | Microsoftによって開発された、大規模言語モデル「Phi3.5」が登場。 スマートフォン上でのローカルな推論を可能にするほど小型でありながら、 Mixtral 8x7BやGPT-3.5などのモデルに匹敵するPhi-3-miniが含まれている。 | |
2024年8月13日 | xAIのGrok-1.5がアップデートされ、Grok-2のベータ版が発表された。 元々の機能の性能が向上し、画像生成機能の追加をしました。 リアルタイムな情報を統合した回答ができるようになり、15→17に変更した。 | 変遷 |
2024年8月8日 | AlibabaのQwenグループが「Qwen2-Math」を公開。 数学に特化したベンチマークでは、 GPT-4oやCluade3.5-sonnet、Llama-3.1-405Bと比較して、最も良い成績を誇る。 | |
2024年7月18日 | OpenAIが従来のGPTよりも費用対効果の高い小型モデルとして GPT-4o miniを発表。 高速かつ低コストで生成クオリティが高く、 GPT-3.5のアップデートとして公開された。 Gemini FlashやClaude Haikuと比べても、 複数のベンチマークで評価されているため45→48に変更。 | 変遷 |
2024年7月10日 | OpenIAはロスアラモス国立研究所と共同で、 マルチモーダルAIモデルが バイオサイエンスの研究をどのように支援できるかを評価するプロジェクトを発表。 特に、視覚、音声、文章などの入力を活用して、 ラボ作業における専門家と初心者のパフォーマンス向上を目指す。45のまま。 | |
2024年6月27日 | Googleが研究者や開発者向けに最新LLM「Gemma 2」を公開。 MetaのLlama 3よりも性能が高く、 ゲーミングノートPCからクラウドまで対応している。 | |
2024年6月7日 | AlibabaのQwenグループが「Qwen2-72B-Instruct」を公開。 大規模言語モデル・大規模マルチモーダルモデルシリーズであり、 英語の質問応答、コーディング、数学、中国語の分野で優れた性能を発揮。 | |
2024年6月6日 | 生成AIを活用してユーザーの思考を支援する 新しい情報整理ツールNotebookLMを公開。 Gemini 1.5 Proを搭載しており、 ドキュメントの読み込みや画像認識も可能に。 | |
2024年5月15日 | Googleから新しいビジョン言語モデル(VLM)の「PaliGemma」が公開。 GoogleのVLMであるPaLI-3から着想を得ており、 SigLIP-So400mを画像エンコーダとして、 Gemma-2Bをテキストエンコーダ統合した、軽量で汎用性の高いVLM。 | |
2024年5月14日 | Googleが高性能な新しいビデオ生成モデルである Veoを搭載した新しい実験的ツールVideoFXを発表。 Text to VideoやImage to Videoの形式でプロンプトを反映して、 1分を超える動画の生成も可能に。 | |
2024年5月14日 | GoogleのGeminiシリーズのなかで最も軽量で、 高速な応答と高いコストパフォーマンスを実現する 「Gemini 1.5 Flash」が公開。 コンテキストウィンドウは100万トークンを維持し、 ベンチマークでGemini 1.0 Ultraと同等のスコアを獲得している。 37→41に変更。 | 変遷 |
2024年5月13日 | 日本時間2024年5月13日、OpenAIがGPT-4oを公開。 テキスト、画像認識、音声認識、文字起こし、音声読み上げなどの 機能を全てを1つのモデルに含む。 旧GPT-4比で生成速度が2倍になっている。42→45に変更。 | 変遷 |
2024年4月23日 | Microsoftからコスト効率の高い小型LLMである「Phi-3-mini」が公開。 3.8Bという非常に小型なモデルながら、 GPT-3.5 Turboよりも優れたパフォーマンスを発揮し、 最新モデルであるClaude 3 Sonnetと同等の性能を有している。12→14に変更。 | |
2024年4月5日 | AnthropicがMessages APIにて Claude 3シリーズ向けにベータ版Tool機能を開放。 ユーザーは事前に定義された特定のツール (例えば、株価を取得するツールや天気情報を提供するツールなど)を 利用して応答を生成できるように。42→44に変更した。 | |
2024年3月28日 | Grokの最新版、Grok-1.5が発表。 推論機能の向上と 128,000 トークンのコンテキスト長が付属され、 コーディングと数学関連のタスクにおけるパフォーマンスが向上した。 | |
2024年3月4日 | 日本時間2024年3月4日、AnthropicがClaude 3を公開。 全ベンチマークでGPT-4を超えるLLMだが、 GPTs、Code Interpreterなどの機能がないことを踏まえて、30→42に設定。 | 変遷 |
2024年2月20日 | 日本時間2024年2月15日、OpenAIが動画生成AI「Sora」を公開。 世界中に激震が走った。 OpenAIのAGI到達レベルを38→42に引き上げた。 | 変遷 |
2024年2月13日 | 日本時間2024年2月8日、GoogleがGemini Ultra 1.0を発表。 Googleの発表によると、OpenAIのGPT-4を超えるとのこと。 Googleのスコアは変わらず、OpenAIのスコアを38に引き上げた。 | 変遷 |
2024年2月6日 | 日本時間2024年2月4日、AlibabaがQwen-1.5を発表。 AlibabaのAGI到達レベルを23→30に引き上げた。 | 変遷 |
– 2024年12月23日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
OpenAI
2024年12月16日、ChatGPT searchが無料プランでも使用可能に。Advanced Voice Modeにも対応し、音声会話での検索ができるように。スマホアプリ版にも地図機能が実装、地元のレストランや施設もできる。
2024年12月17日、API版のOpenAI o1が新機能とともにTier 5以上の開発者向け限定でリリース。
Advanced Voice ModeのAPI版、Realtime APIがアップデート。さらに新手法「Preference Fine-Tuning(選考性ファインチューニング)」が登場。
2024年12月18日、ChatGPT用の電話番号「1-800-ChatGPT(1-800-242-8478)」が登場。
米国限定だが、アカウント&利用料なしで、毎月15分まで通話可能。WhatsAppによるメッセージのやり取りにも対応。
2024年12月19日、macOSアプリ版ChatGPTが大幅アップデート。連携できるコーディングアプリが追加され、連携できるノートアプリも追加。2025年明けからは、Windowアプリや無料版でもリリース予定。
2024年12月20日、史上最もAGI(汎用人工知能)に近いLLM「OpenAI o3 / o3-mini」が登場。
o3は「ARC-AGI」を史上初めてクリアし、AGIに一歩近づいたとのこと。67→72に変更。
Googleが2024年12月20日に「Gemini 2.0 Flash Thinking」を公開。
ライバルであるOpenAI o1の推論トークンと似た技術で「回答毎に思考過程を繰り返し生成して結論に至る」という仕組み。実際に検証したところ、o1の方が優れているという結果になったが、生成スピードはGemini 2.0 Flash Thinkingの方が上だった。61→64に変更。
– 2024年12月16日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
OpenAI
2024年12月5日、OpenAIが強化学習型ファインチューニングを発表。 特定タスクへの特化に加え、正確性の向上も実現したそう。 現在は研究・企業向けのみ募集している。
2024年12月9日、OpenAIがSoraを公開。 今年の2月に発表されており、テキスト・画像・動画からの動画生成が直感的に行える。 高品質な動画生成が可能。
2024年12月10日、ChatGPTユーザー全員全員がCanvas機能が利用できるように。 2024年10月に有料プランで先行公開された機能。 Canvasだけで文書作成やコーディングが完結させられるように。
2024年12月11日、Apple IntelligenceとChatGPTが連携。 Siriのように必要に応じてChatGPTが質問に回答してくれ、 カメラとの連携やMac上での補助ができるように。
2024年12月12日、Advanced Voice Modeに、 端末のカメラを使ったビデオ通話&画面共有の機能「Advanced voice with video」が追加。 カメラや画面の内容をリアルタイムで共有できるように。
2024年12月13日にChatGPTでの作業を助ける新機能「プロジェクト(Projects)」が実装。 チャット・ファイル・カスタム指示の一括管理ができる機能で、より便利に。
Google
Googleが2024年12月9日にリリースした最新の実験段階LLM「gemini-exp-1206」 200万トークン超のコンテキストウィンドウを持ち、マルチモーダルに機能を搭載。 総合性能(Overall)で1位を獲得し、さまざまなタスクで高い性能を発揮。
Googleが2024年12月12日に「Gemini2.0 Flash」を公開。 情報を処理するだけでなく、ユーザーのニーズや背景を理解し、 その情報を基に「次に何が必要か」を考え、さらにその計画に従って行動できるモデルとして設計されている。
xAI
2024年12月9日にxAIのGrokから画像生成機能が公開。 より人間のアイディアに沿った画像が生成でき、xのすべてのユーザーで利用可能に。20→23に変更。
2024年12月12日、Grok2がxのすべてのユーザーに公開。 8月にリリースしたものより3倍ほど高速で、精度の向上もされた。
Microsoft
2024年12月13日、MicrosoftからPhi-4が発表。 140億パラメータでありながらもGPT-4oと同等な性能を持つとされ、数学タスクではLLMをも凌駕するとのこと。
– 2024年12月5日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
2024年12月5日、OpenAIが「ChatGPT Pro」を公開。 長く熟考する代わりに、理数科目や法律関連でより高度な問題解決能力を発揮する。 従来のo1を差し置いて圧倒的なベンチマークを獲得。57→61に変更。
2024年12月4日にGoogleが「Genie2」を公開。 テキストや画像から3D仮想世界を生成する基盤世界モデル。 人やAI(エージェント)がキーボードやマウスを使って操作すると、その結果をシミュレーションして画面に反映できるように。 49→52に変更。
– 2024年11月28日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
2024年11月28日にQwenグループから「QwQ」が登場。 AI推論機能の進化に焦点を当てた、実験的研究モデルかつ未知の境界に深く向き合うことを目指したLLM。 数学やプログラミングの分野で期待されているが、研究段階のモデル。36→37に変更。
2024年11月26日Anthropicから「Model Context Protocol」がリリース。 AIシステムがGoogle DriveやSlack、GitHub、Postgresなどの複数のデータやツールと共通の標準プロトコルで連携可能。 サービス間の文脈を維持しながら効率的にデータを扱えるように。50→54に変更。
– 2024年11月15日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
2024年11月15日、Googleから新たなGeminiモデル「Gemini-exp-1114」が公開。 ベンチマーク上ChatGPTを抑え、総合世界1位に。複雑で曖昧な指示や難しい質問にも的確に応答する能力を持ち、 さらに数学的な計算や数式に基づく問題を正確に解く能力が優れているとのこと。 45→49に変更。
2024年11月12日、アリババクラウドが新たな大規模言語モデル「Qwen2.5-Coder」を公開。 「Qwen2.5」のコードバージョンである「Qwen2.5-Coder」は、オープンソースで公開され、コードアシスタントやコード生成に活用可能。 GPT-4oのコーディング能力に匹敵する性能があるとして、35→36に変更。
2024年10月31日、OpenAIが検索エンジン機能「ChatGPT search」をChatGPTに実装。 GoogleやPerplexityといった外部の検索エンジンにアクセスしなくても、必要十分な情報が引用付きで得られるように。 リアルタイム検索が可能となったことで利便性が向上。よって、54→57に変更。
2024年10月22日、イーロンマスクが率いるAI企業xAIがAPIを公開。 Grokモデルを使用するためのAPIであり、エンジニアや開発者はGrokの大規模言語モデルをもとにアプリケーションの開発が可能に。 17→20に変更。
– 2024年10月23日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
2024年10月23日にClaude 3.5 Sonnetの更新と、新しいClaude 3.5 Haikuを公開。さらに、computer useというAPI経由で動作するAIエージェントも発表。47→50に。
しかし、この機能はベータ版で、スクロールやドラッグが苦手で、スパムや詐欺への流用が懸念されている。
– 2024年10月10日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
2024年10月10日にGoogleが「Imagen3」を公開。 人物の表情や服のしわ、風景の細かな質感など、より細部まで正確に再現できるように。 また、テキストの描画能力も格段に向上。よって43→45に更新。
– 2024年10月3日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
日本時間2024年10月3日、ChatGPTの新機能「Canvas」が公開された。 生成した文章・ソースコードの気になる箇所を指定してピンポイントで修正ができる GPT-4oでは素のモデルよりも、コメントの正確性が30%、質が16%向上した。
– 2024年9月25日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
「Advanced Voice Mode」がChatGPT アプリPlusとTeamユーザーに公開された。 日本語を含む50以上の言語に対応しており、自然な音声会話が可能。 9種類の音声から選択でき、口調やアクセントの記憶までできるようになった。 その精度の良さに全世界のユーザーが驚いた。49→52に変更。
2024年9月24日Geminiの最新版「Gemini-1.5-Pro-002 / Gemini-1.5-Flash-002」が公開。 GPT-4oと比較したところ、理数科目のタスクに対してはそこまで良い結果が得られなかった。 しかし、要約タスクでは、順番を変更したり、複数の表を使ることで読みやすい回答を得られた。よって、42→43に更新した。
– 2024年9月12日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
日本時間2024年9月12日、OpenAI o1-previewを公開。 このモデルは回答する前に考えるように設計され、より複雑なタスクに対しても回答が可能になった。 特に物理学、化学、生物学、数学での高いベンチマークで評価されている。しかし、回数制限があることを踏まえ、48→49に変更。
同日にGoogleが、ハルシネーション(幻覚)を抑えたモデル「DataGemma」を公開。 実際に使ってみた結果、間違った情報を出力することはなかったが、求めていた情報を完全に出力することができなかったため、大幅な変更はなく、41→42。
– 2024年8月29日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
Qwen2-VLは、アリババクラウドが発表した最新の視覚言語モデルであり、優れた視覚理解能力を持っているとのこと。
弊社で検証してみた結果、確かに忠実に画像を認識し、解説できることがわかった。動画の解析もできるということで、33に設定。
– 2024年8月13日更新 –
AIビックテックのAGI到達レベルの変遷

– 2024年7月18日更新 –
AIビックテックのAGI到達レベルの変遷

– 2024年5月14日更新 –
AIビックテックのAGI到達レベルの変遷

– 2024年5月13日更新 –
AIビックテックのAGI到達レベルの変遷

– 2024年4月23日更新 –
AIビックテックのAGI到達レベルの変遷

– 2024年4月5日更新 –
AIビックテックのAGI到達レベルの変遷

– 2024年2月20日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
2024年2月15日、OpenAIが動画生成AI「Sora」を公開。世界中に激震が走った。
Soraは、ユーザーがプロンプトで何を要求したかだけでなく、それらのものが物理世界にどのように存在するのかも理解し、もはや本物と見分けがつかないレベルの動画生成が可能。
公式文書では、Soraは「AGI達成への重大なマイルストーンである」と述べられており、AIの技術革新を大きく推し進めた。
– 2024年2月13日更新 –
AIビックテックのAGI到達レベルの変遷

– 2024年2月7日更新 –
AIビックテックのAGI到達レベルの変遷

変更理由
Alibabaの数値を23%から30%に変更した。
日本時間2024年2月4日、AlibabaがQwen-1.5を発表。今回のQwen-1.5は、2023年に発表されていたQwenの強化版。
公式のレポートによると、Claude-2.1、GPT-3.5-Turbo-0613を上回り、GPT-4に迫る性能。その状況を見て、AlibabaのAGI到達レベルを30に引き上げた。
※我々の検証によって、到達レベルを変更する可能性あり。(https://qwenlm.github.io/blog/qwen1.5/)
AGI終末時計について
終末時計が、世界の平和を祈る注意喚起であるように、
AGI終末時計も、AIによる支配を目指すものではありません。
むしろ日本らしいロボットアニメやドラえもんのような、
AIとの共創カルチャーを目指し、
子どもたちがAI-Nativeな時代で楽しく過ごせるように。
私たち大人が「未来に追いつく指標作り」をヴィジョンとして運営していきます。
このAGI終末時計は、皆様からのご意見を元に客観的な視点をもって随時更新されていくことを前提としています。
AGI度数やAGIレベル、そしてそれぞれの数値について皆さんのご意見や批判を受け付けております。
ご意見がある際はX(Twitter)にて #AGI終末時計 とつけてポストしてください。
弊社で確認させていただきます。
【運営元のWEELについて】
運営元のWEELについて
WEELはただの情報発信ではなく、未来予測をする拠点としてメディアを位置付けてきました。
活動は多岐にわたり、
- OpenAIやGAFAMの生成AI競争の記事化
- 次のトレンドを予測して、GitHubで生成AIのOSSをレビュー
- HuggingFaceから面白いLLMを記事化
- お客様のPC操作を模倣する自律型AIの開発
etc…
これまでの活動で得たノウハウ、最新情報、
そして皆様からのフォードバックとお便りをもって
AGI終末時計を更新し続け、現在のAIの進歩を可視化することで
AGIの到来にどこまで近づいているかお伝えします。
