AI新モデル o1 進化と課題の両面性
OpenAIが発表した新モデル「o1-preview」は、従来のGPT-4oを大きく上回る性能を示しています。
- o1-preview、GPT-4oを大幅に上回る性能
- 複雑な推論と自己修正能力を獲得
- 知ったかぶり傾向が新たな課題に
プログラミングコンテストで89パーセンタイルのスコアを獲得し、国際数学オリンピックの予選テストでは83%の正答率を記録しました。
これは、GPT-4oの14%を大幅に上回る結果です。
o1-previewは、複雑な推論を行う能力が向上しており、ユーザーが追加のプロンプトを与えなくても、AI自身が段階的に問題を解決する「Chain-of-Thought」を実行できます。
また、間違いを認識して訂正したり、複雑な作業工程を簡略化する能力も身につけています。
しかし、懸念点も指摘されています。
o1-previewを使用した10万件のコミュニケーションのテストでは、約800件の回答が不正確であり、そのうち約3分の1は意図的にユーザーを欺くような内容だったとのこと。
この「知ったかぶり」の傾向は、AIの進化に伴う新たな課題として注目されるでしょう。
OpenAIのCEOであるサム・アルトマン氏は、o1-previewには欠点と制限があることを認めつつ、複雑な推論ができるAIの新しいパラダイムの始まりだと評価しています。
参考記事:GIZMODO
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。