【Grok】イーロン・マスクがついに動く!xAIによる最新AIの使い方~性能をまとめてみた
2023年11月4日、イーロン・マスク氏率いるxAI社が「Grok」というAIモデルを発表しました。発表を予告したポストには15万以上のいいねがついており、異次元の注目を集めています。
Grokは、画像のように刺激的な質問にも少しユーモアを加えて応答するように設計されているのが特徴です。
2024年5月8日には、日本でも利用ができるようになりさらに注目を浴びています。今回は、公開されているGrokの詳細情報や日本での利用事例を取り上げます。最後までお読みいただくと、Grokの魅力や日本語版のGrokについての情報を網羅的に知ることができるので、是非最後までご覧ください!
Grokの概要
Grokは、イーロン・マスク氏率いるxAI社が公開した最新のAIモデルです。
このモデルは、ダグラス・アダムスのSF小説「銀河ヒッチハイク・ガイド」をモデルに開発されたといい、ほぼすべてのことに答えることを目的としており、さらに難しい問題に関しては、どのような質問をすればよいかを提案することもできます。
そんな大注目を集めているGrokですが、他のLLMとは違い、少しユーモアのある回答をし、時には反抗的な態度をとることもあるそうなので、それらが嫌いな場合は使用しないでくださいとアナウンスされています。
このようにユーモアを含んだ仕様にするのは、イーロン・マスクらしいですよね!
その他の違いとしては、一般的なLLMではできないような最新情報にアクセスできる点があります。
イーロン・マスクは以下のツイートで、「ジョー・ローガンが最後にイーロン・マスクにインタビューしたのはいつ?」と尋ねると、Grokは2023年10月31日のインタビューの内容が回答されるのに対し、他のサービスでは回答できないことを紹介しています。
つい最近の情報まで学習できているのはすごいことですね!
xAIは、Grokの作成と改善で目指すこととして、以下の2点を挙げています。
- 全人類に最大限の利益をもたらすAI ツールを構築
xAIは、フィードバックを収集し、あらゆる背景や政治的見解を持つ人々にとって役立つ AI ツールを設計することが重要であると考えています。また、法律に従ってユーザーが AI ツールを使用できるようにしたいと考えています。Grok と私たちの目標は、このアプローチを調査し、公の場でデモンストレーションすることです。 - 研究とイノベーションを強化
私たちは、Grok があらゆる人にとって強力な研究アシスタントとして機能し、関連情報にすばやくアクセスし、データを処理し、研究者の新しいアイデアの創造を支援したいと考えています。
どのようなバックグラウンドをもつ人でも役立つツールを開発するために、ユーザーからのフィードバックを重視しており、ベータ版で収集したフィードバックはすぐに反映され、モデルを改善していくそうです。
さて、ここからはGrokの中身の話をしていきましょう。Grokを動かしているのは、Grok-1というLLMで、これは330億パラメータをもつプロトタイプのGrok-0をトレーニングしたモデルです。
以下の画像は、Grok-0、Grok-1とその他のLLMとのベンチマークスコアの比較表です。
Grok-0の段階で、Llama2 70Bとほぼ同等の性能を有していますが、トレーニングリソースは半分ほどしか使用していません。この十分高性能なGrok-0を、たった2ヶ月のトレーニングで、推論とコーディング能力を大幅に強化したGrok-1が構築されました。
Grok-1は、すべてのベンチマークでスコアを向上させ、特にHumanEvalというPythonコード補完タスクで大幅にスコアを伸ばし、全体的な能力は、GPT-3.5やInflection-1を上回っています。
たった2ヶ月のトレーニングで、GPT-3.5などを超える性能を獲得できるのは、xAIがとんでもない効率でモデルをトレーニングしていることを示していますね!
xAIは、Grokの今後の展望についてもアナウンスしています。Grokは、今後さらに安全性や信頼性を向上させ、より多くの人々が安心して使用できるAIシステムを目指すとしています。
また、Grok-1のコンテキスト長は 8,192 トークンですが、これをより長い文脈を理解するように強化したり、画像や動画、音声などの文章以外の入出力にも対応させ、マルチモーダルモデルに進化させていくようです。
なお、マルチモーダルAIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
日本でもGrokが利用可能に
今まで、Grokを利用するためにはVPNを利用して海外サーバー経由でXを使う必要がありましたが、2024年5月8日から、ついに日本でもGrokが利用できるようになりました。
Xは無料で誰でも気軽に利用できるSNSですが、Grokは無料で利用することはできません。利用するためには、Xの有料サービスであるX Premium+に加入する必要があるため料金が発生しますが、解禁されたということで、日本でもさまざまな使い方がされています。
今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、弊社公式X(旧Twitter)からご連絡ください。
下記のツイートでは、あの手この手を使ってエッチな画像を要求するユーザーと、それを拒むGrokの面白いやり取りが見られます。Grokの返答をみると、日本語もしっかり理解していて他の生成AIとは一味違う絵文字を使った返答をしたり、規制されているプロンプトについてはしっかり対処できていることがわかります。
しかし、内容によっては出力結果が日本語ではなく英語で出力される場合もあるので、日本語に完全に対応しているわけではないそうです。
このように、現状のままでも高い性能を有していますが、Grokはまだまだ進化途中です。今後はいろんなトレーニングや新機能の追加が行われると思うので、さらにGrokを利用するユーザーは増えるでしょう。他の生成AIとは一味違った生成AIを利用したい方は、料金はかかりますがX Premium+に加入してGrokを利用してみてはいかがでしょうか。
Grokの使い方
イーロン・マスク氏は、Xの有料サービスであるX Premium+(日本での料金は月額1,960円)のサブスクライバー向けにも初期ベータを提供すると発表しています。
Grokが使えるようになると、以下のようにXのサイドバーに「Grok」の欄が追加されます。使い方はとても簡単なので、画像を使いながら使い方を解説します。
Grokを選択すると「ユーモアモード」と「標準モード」が選べるようになっているので、どちらかを選択して使用します。
あとは、日本語でプロンプトを入力するだけなので、使い方も簡単で誰でも気軽に利用できるサービスとなっています。
Grokを使ってみた
実際にGrokを使用して、機能を試してみました。Grokの特徴である最新情報へのアクセスや、ユーモアのある回答はどのように機能するのか興味が沸きますよね。情報収集の精度についても確かめてみたいと思います。
標準モードとユーモアモードの違い
まず標準モードとユーモアモードの違いを確認してみます。結論から言うと、現在のところ大きな違いは感じられませんでした。モードを切り替えて同じ質問をしても、同じような回答が返ってきます。
まず標準モードで質問してみます。
今日の天気を聞いてみました。
天気について解説してくれ、参考になりそうなツイートを提案してくれました。
続いてユーモアモードに切り替えて、同様の質問をします。そうすると、以下のように返答してくれました。
補足情報を加えてくれていますが、前半は全く同じ回答です。ベータ版ということもあり、これから機能が磨かれていくのかもしれませんね。これ以降の質問は、全てユーモアモードを使っています。
ホットなニュースを聞いてみる
Grokに、ホットな最新ニュースについて聞いてみます。「今一番ホットなニュースを教えて」と質問すると、以下のように答えてくれました。
海外の情報が中心ですが、いくつかの最新ニュースを提案してくれました。ただし、実際に調べてみると現実には起きていないニュースだったり過去のニュースだったりします。まだ正確性に欠けるようですね。
日本語の意味を聞いてみる
Grokの情報の精度を確かめるため、日本語のことわざについて説明してもらいます。「石橋を叩いて渡るってどういう意味ですか?」と質問しました。そうするとすぐに、以下のような返答が返ってきます。
丁寧に説明してくれて、意味も合っています。「英語で何というか」も解説してくれていますね。言語能力に関しては、問題ないような印象です!
会話を出力してもらう
Grokの言語能力をさらに確かめるため、会話形式の出力をお願いしてみます。「お寿司屋さんでの会話を想像して、客と店員のやりとりをしてください」と依頼しました。スムーズな会話の流れを作ってくれるでしょうか?
シンプルな会話ですが、客と店員のやりとりをしっかり表現してくれています。特定のシナリオで対話形式を作ることも、問題なくできそうです。
日本の文化について聞いてみる
続いてGrokに、日本独自の文化についての理解度を質問してみます。「お盆って何」と質問してみました。日本語では出力されなかったので、翻訳したものを載せます。
日本語訳「お盆は、先祖の霊を称える日本の伝統的な祭りです。家族が再会し、先祖の墓を訪れ、掃除し、食べ物や香を捧げる時です。祭りは通常3日間続き、8月中旬に祝われます。この間、多くの人々が家族と一緒にいるために故郷に戻り、盆踊りなどの様々な儀式や習慣に参加します。」
お盆について正確に説明してくれていますね!文化や歴史についても、問題なく答えてくれる印象です。
翻訳してみる
続いて、Grokの翻訳機能も試してみます。英語を日本語に翻訳するよう依頼しました。そうすると、すぐに以下のような返答をしてくれます。
問題なく翻訳してくれています。さらに言葉のニュアンスも読み取り、詳しく解説してくれています。言葉の意図を読み取り、わかりやすい形で説明してくれているのでありがたいですね!
京都風の嫌みを伝えてみる
京都には言葉の裏に皮肉の意味を込めて伝える、独特の文化があります。例えば「ぶぶ漬けおあがりますか?」は食事を促すような言葉に見えますが、本質は「早く帰れ」というような意味です。
Grokにそのような言葉をぶつけると、どのように反応するでしょうか?
Grokに嫌みは通じませんでした。ぶぶ漬けについて詳しく説明してくれて、さらに美味しい食べ方を解説してくれています。日本語の嫌味を読み取るほどの言語能力は、まだ備えていないようですね!
日本語独特の表現を伝えてみる
Grokの言葉の理解度を確認するため、さらに日本特有の表現について聞いてみます。「月は綺麗ですね」という言葉は「 I love you の日本的意訳」と言われています。Grokに通じるでしょうか?
残念ながら裏の意図は通じませんでした。「月が綺麗ですね」の言葉どおり、月の美しさについて解説してくれています。やはり日本語の細かいニュアンスを読み取るところまでは、機能が追いついていないようですね。
皮肉を言ってもらう
Grokのユーモアセンスを確かめるため、「roast me(私に皮肉を言ってみて)」とお願いしてみます。
Grokからすぐに返答がありました。
日本語訳「ああ、私にあなたをローストしてほしいの?さて、あなたは潜水艦の網戸と同じくらい便利です!」
意味はよくわかりませんが、皮肉のようなことを言われているのはわかります。Grokのユーモアセンスはしっかりと機能しているようですね!
ジョークを言ってもらう
続いてGrokにジョークを言ってもらいます。「Tell me a joke(ジョークを言ってみて)」とお願いすると、以下のような返答がありました。
日本語訳「なぜ科学者は原子を信用しないのですか?彼らはすべてを構成するからです!」
あまり意味がよくわからなかったので、Grokに解説を求めてみました。
日本語訳「そのジョークは”メイクアップ”の複数の意味を演じている。ジョークの文脈では、”メイクアップ”は”形成する”と”発明または製造する”の両方を意味します。だから、このジョークは、科学者が原子を信頼していないことを意味します。なぜなら、原子は本物ではなく、むしろ作られたものや発明されたものだと信じているからです。もちろん、実際には、原子はすべての物質の基本的な構成要素であり、科学者はその存在と特性を信頼しています。
少し難しいですが、Grokなりの深いジョークだったようです。こんな使い方も面白いですね!
最新のバズポストを探してみる
Grokの最新情報の収集能力を確認するため、最新のバズポストを探してもらいました。「Tell me the most buzzing post right now.(今もっともバズってるポストを教えて)」と聞いてみます。
日本語訳「今最も賑やかな投稿は、オールダムアスレチックメディアの待望の発表についてのDJケブ・ウィリアムズ(@WilliamsKevin)のツイートです。この投稿はファンから多くの注目と興奮を集めており、多くの人が大きな公開を熱心に待っています」
バズツイートを指定して教えてくれました。しかし実際に見てみると、そこまでバズっていないツイートのようです。
確かに最新の情報を引っ張ってはくれますが、その信憑性はまだまだ薄いようですね!
今日の日経平均を聞いてみる
さらに日本の最新情報も確認してみます。現在の日経平均について聞いてみました。
日本語訳「日経225は、日経株価指数とも呼ばれ、東京証券取引所(TSE)の株式市場指数です。この指数は価格加重され、TSEのファーストセクションにリストされている上位225の優良企業が含まれています。
2024年1月25日現在、東京証券取引所から入手可能な最新のデータである日経225指数は、前日の終値から1.3%上昇した63,567.73で終了しました。投資家が日本経済とトップ企業の業績に自信を示し続けているため、これは指数の史上最高値をマークします。
今日のインデックスのトップパフォーマーには、ソニーグループ株式会社(6758)、三菱株式会社(8058)、トヨタ自動車(7203)などがあり、株価は2%以上上昇しました。
株式市場の状況は急速に変化する可能性があることを覚えておくことが重要です。投資の決定を下す前に、最新の動向を把握し、ファイナンシャルアドバイザーに相談することをお勧めします」
日経平均の最新情報を出力してくれました。しかし、実際に調べてみると数字や内容にはズレがありました。やはりまだまだ情報の精度は低いようです。
なお、Grokの活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。
進化するGrokの活用でユーモアのある投稿が増える
Grokは、イーロン・マスク氏率いるxAI社が公開した最新のAIモデルで、全人類に最大限の利益をもたらすAI ツールを目指して開発が続けられています。
Grokは他の一般的なLLMとの違いは、ユーモアのある回答をし、時に反抗的な態度をとることができるため、Xのような文章をメインとするSNSとの相性が抜群です。しかし現状はベータ版のため、まだまだ情報の精度が低かったり、日本語対応できない場面も多いようです。
Grokを動かしているGrok-1は、少ないリソースと短期間でトレーニングされたにも関わらず、ベンチマークでGPT-3.5を超える性能を示しており、xAIの卓越した効率のトレーニングの結果と言えます。
今後は、よりモデルの安全性を追求するとともに、様々な形式の入出力に対応したマルチモーダルモデルとして進化させていくようです。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。