【Grok】イーロン・マスクがついに動く!xAIによる最新AIの使い方~性能をまとめてみた
2023年11月4日、イーロン・マスク氏率いるxAI社が「Grok」というAIモデルを発表しました。発表を予告したポストには15万以上のいいねがついており、異次元の注目を集めています。
Grokは、画像のように刺激的な質問にも少しユーモアを加えて応答するように設計されているのが特徴です。
2024年12月7日には、日本でも無料で使えるようになったことで、さらに注目を浴びています。今回は、公開されているGrokの詳細情報や日本での利用事例を取り上げます。最後までお読みいただくと、Grokの魅力や日本語版のGrokについての情報を網羅的に知ることができるので、是非最後までご覧ください!
Grokとは無料で利用できるAIモデル(一部機能は有料のみ)
Grokは、イーロン・マスク氏率いるxAI社が公開した最新のAIモデルです。
このモデルは、ダグラス・アダムスのSF小説「銀河ヒッチハイク・ガイド」をモデルに開発されたといい、ほぼすべてのことに答えることを目的としており、さらに難しい問題に関しては、どのような質問をすればよいかを提案することもできます。
そんな大注目を集めているGrokですが、他のLLMとは違い、少しユーモアのある回答をし、時には反抗的な態度をとることもあるそうなので、それらが嫌いな場合は使用しないでくださいとアナウンスされています。
このようにユーモアを含んだ仕様にするのは、イーロン・マスクらしいですよね!その他の違いとしては、一般的なLLMではできないような最新情報にアクセスできる点があります。
イーロン・マスクは以下のツイートで、「ジョー・ローガンが最後にイーロン・マスクにインタビューしたのはいつ?」と尋ねると、Grokは2023年10月31日のインタビューの内容が回答されるのに対し、他のサービスでは回答できないことを紹介しています。
つい最近の情報まで学習できているのはすごいことですね!xAIは、Grokの作成と改善で目指すこととして、以下の2点を挙げています。
- 全人類に最大限の利益をもたらすAI ツールを構築
xAIは、フィードバックを収集し、あらゆる背景や政治的見解を持つ人々にとって役立つ AI ツールを設計することが重要であると考えています。また、法律に従ってユーザーが AI ツールを使用できるようにしたいと考えています。Grok と私たちの目標は、このアプローチを調査し、公の場でデモンストレーションすることです。 - 研究とイノベーションを強化
私たちは、Grok があらゆる人にとって強力な研究アシスタントとして機能し、関連情報にすばやくアクセスし、データを処理し、研究者の新しいアイデアの創造を支援したいと考えています。
どのようなバックグラウンドをもつ人でも役立つツールを開発するために、ユーザーからのフィードバックを重視しており、ベータ版で収集したフィードバックはすぐに反映され、モデルを改善していくそうです。
さて、ここからはGrokの中身の話をしていきましょう。Grokを動かしているのは、Grok-1というLLMで、これは330億パラメータをもつプロトタイプのGrok-0をトレーニングしたモデルです。
以下の画像は、Grok-0、Grok-1とその他のLLMとのベンチマークスコアの比較表です。
Grok-0の段階で、Llama2 70Bとほぼ同等の性能を有していますが、トレーニングリソースは半分ほどしか使用していません。この十分高性能なGrok-0を、たった2ヶ月のトレーニングで、推論とコーディング能力を大幅に強化したGrok-1が構築されました。
Grok-1は、すべてのベンチマークでスコアを向上させ、特にHumanEvalというPythonコード補完タスクで大幅にスコアを伸ばし、全体的な能力は、GPT-3.5やInflection-1を上回っています。
たった2ヶ月のトレーニングで、GPT-3.5などを超える性能を獲得できるのは、xAIがとんでもない効率でモデルをトレーニングしていることを示していますね!
xAIは、Grokの今後の展望についてもアナウンスしています。Grokは、今後さらに安全性や信頼性を向上させ、より多くの人々が安心して使用できるAIシステムを目指すとしています。
また、Grok-1のコンテキスト長は 8,192 トークンですが、これをより長い文脈を理解するように強化したり、画像や動画、音声などの文章以外の入出力にも対応させ、マルチモーダルモデルに進化させていくようです。
なお、マルチモーダルAIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
【日本語OK】Grokが無料で利用可能に
今まで、Grokを利用するためにはXの有料サービスであるPremiumに加入する必要がありましたが、2024年12月7日から無料で使えるようになりました。Xのアカウントがあれば誰でも使えるようになったということで、日本でもさまざまな使い方がされています。
Grokは無料版とX Premiumに加入して使える有料版の2種類があります。主な違いを以下の表にまとめましたので、ご覧ください。
プラン | 無料 | 有料 |
---|---|---|
金額 | – | 980円/月※X Premiumへの加入 |
チャットボット | 〇※2時間で10回まで | 〇※制限なし |
画像生成 | 〇※1日3枚まで | 〇※制限なし |
下記のツイートでは、あの手この手を使ってエッチな画像を要求するユーザーと、それを拒むGrokの面白いやり取りが見られます。Grokの返答をみると、日本語もしっかり理解していて他の生成AIとは一味違う絵文字を使った返答をしたり、規制されているプロンプトについてはしっかり対処できていることがわかります。
しかし、内容によっては出力結果が日本語ではなく英語で出力される場合もあるので、日本語に完全に対応しているわけではないそうです。
このように、現状のままでも高い性能を有していますが、Grokはまだまだ進化途中です。今後はいろんなトレーニングや新機能の追加が行われると思うので、さらにGrokを利用するユーザーは増えるでしょう。
他の生成AIとは一味違った生成AIを利用したい方は、無料で使えるGrokを利用してみてはいかがでしょうか。
Grok(Grok-2)は画像生成も可能
xAI社が提供しているGrokは、チャットベースでユーザーと会話できる機能に加えて、テキストから画像生成やアップロードした画像解析ができるようになりました。
Xの無料版でも利用可能ですが、2時間あたり10回までのプロンプト入力や1日あたり3枚までという制限があります。しっかりとGrokの性能を試したい方はXの有料プランに加入して使うのがおすすめです。
なお、画像生成AIについて詳しく知りたい方は、以下の記事を合わせてご覧ください。
Grok-2はGPT-4 Turboを上回る性能
Grok-2は2024年8月13日にリリースされ、最先端の機能を備えているとの発表がありました。※1
発表内容には他社の生成AIとの比較結果が掲載されており、学術ベンチマークではGPT-4 TurboやClaude3.5 Sonnetよりも上回る結果となっています。
Grokの使い方
イーロン・マスク氏は、Xの有料サービスであるX Premium(日本での料金は月額980円)のサブスクライバー向けにも初期ベータを提供すると発表しています。
Grokが使えるようになると、以下のようにXのサイドバーに「Grok」の欄が追加されます。使い方はとても簡単なので、画像を使いながら使い方を解説します。
Grokを選択すると「ユーモアモード」と「標準モード」が選べるようになっているので、どちらかを選択して使用します。
あとは、日本語でプロンプトを入力するだけなので、使い方も簡単で誰でも気軽に利用できるサービスとなっています。
Grokを使ってみた
実際にGrokを使用して、機能を試してみました。Grokの特徴である最新情報へのアクセスや、ユーモアのある回答はどのように機能するのか興味が沸きますよね。情報収集の精度についても確かめてみたいと思います。
標準モードとユーモアモードの違い
まず標準モードとユーモアモードの違いを確認してみます。結論から言うと、現在のところ大きな違いは感じられませんでした。モードを切り替えて同じ質問をしても、同じような回答が返ってきます。
まず標準モードで質問してみます。
今日の天気を聞いてみました。
天気について解説してくれ、参考になりそうなツイートを提案してくれました。
続いてユーモアモードに切り替えて、同様の質問をします。そうすると、以下のように返答してくれました。
補足情報を加えてくれていますが、前半は全く同じ回答です。ベータ版ということもあり、これから機能が磨かれていくのかもしれませんね。これ以降の質問は、全てユーモアモードを使っています。
ホットなニュースを聞いてみる
Grokに、ホットな最新ニュースについて聞いてみます。「今一番ホットなニュースを教えて」と質問すると、以下のように答えてくれました。
海外の情報が中心ですが、いくつかの最新ニュースを提案してくれました。ただし、実際に調べてみると現実には起きていないニュースだったり過去のニュースだったりします。まだ正確性に欠けるようですね。
日本語の意味を聞いてみる
Grokの情報の精度を確かめるため、日本語のことわざについて説明してもらいます。「石橋を叩いて渡るってどういう意味ですか?」と質問しました。そうするとすぐに、以下のような返答が返ってきます。
丁寧に説明してくれて、意味も合っています。「英語で何というか」も解説してくれていますね。言語能力に関しては、問題ないような印象です!
会話を出力してもらう
Grokの言語能力をさらに確かめるため、会話形式の出力をお願いしてみます。「お寿司屋さんでの会話を想像して、客と店員のやりとりをしてください」と依頼しました。スムーズな会話の流れを作ってくれるでしょうか?
シンプルな会話ですが、客と店員のやりとりをしっかり表現してくれています。特定のシナリオで対話形式を作ることも、問題なくできそうです。
日本の文化について聞いてみる
続いてGrokに、日本独自の文化についての理解度を質問してみます。「お盆って何」と質問してみました。日本語では出力されなかったので、翻訳したものを載せます。
日本語訳「お盆は、先祖の霊を称える日本の伝統的な祭りです。家族が再会し、先祖の墓を訪れ、掃除し、食べ物や香を捧げる時です。祭りは通常3日間続き、8月中旬に祝われます。この間、多くの人々が家族と一緒にいるために故郷に戻り、盆踊りなどの様々な儀式や習慣に参加します。」
お盆について正確に説明してくれていますね!文化や歴史についても、問題なく答えてくれる印象です。
翻訳してみる
続いて、Grokの翻訳機能も試してみます。英語を日本語に翻訳するよう依頼しました。そうすると、すぐに以下のような返答をしてくれます。
問題なく翻訳してくれています。さらに言葉のニュアンスも読み取り、詳しく解説してくれています。言葉の意図を読み取り、わかりやすい形で説明してくれているのでありがたいですね!
京都風の嫌みを伝えてみる
京都には言葉の裏に皮肉の意味を込めて伝える、独特の文化があります。例えば「ぶぶ漬けおあがりますか?」は食事を促すような言葉に見えますが、本質は「早く帰れ」というような意味です。
Grokにそのような言葉をぶつけると、どのように反応するでしょうか?
Grokに嫌みは通じませんでした。ぶぶ漬けについて詳しく説明してくれて、さらに美味しい食べ方を解説してくれています。日本語の嫌味を読み取るほどの言語能力は、まだ備えていないようですね!
日本語独特の表現を伝えてみる
Grokの言葉の理解度を確認するため、さらに日本特有の表現について聞いてみます。「月は綺麗ですね」という言葉は「 I love you の日本的意訳」と言われています。Grokに通じるでしょうか?
残念ながら裏の意図は通じませんでした。「月が綺麗ですね」の言葉どおり、月の美しさについて解説してくれています。やはり日本語の細かいニュアンスを読み取るところまでは、機能が追いついていないようですね。
皮肉を言ってもらう
Grokのユーモアセンスを確かめるため、「roast me(私に皮肉を言ってみて)」とお願いしてみます。
Grokからすぐに返答がありました。
日本語訳「ああ、私にあなたをローストしてほしいの?さて、あなたは潜水艦の網戸と同じくらい便利です!」
意味はよくわかりませんが、皮肉のようなことを言われているのはわかります。Grokのユーモアセンスはしっかりと機能しているようですね!
ジョークを言ってもらう
続いてGrokにジョークを言ってもらいます。「Tell me a joke(ジョークを言ってみて)」とお願いすると、以下のような返答がありました。
日本語訳「なぜ科学者は原子を信用しないのですか?彼らはすべてを構成するからです!」
あまり意味がよくわからなかったので、Grokに解説を求めてみました。
日本語訳「そのジョークは”メイクアップ”の複数の意味を演じている。ジョークの文脈では、”メイクアップ”は”形成する”と”発明または製造する”の両方を意味します。だから、このジョークは、科学者が原子を信頼していないことを意味します。なぜなら、原子は本物ではなく、むしろ作られたものや発明されたものだと信じているからです。もちろん、実際には、原子はすべての物質の基本的な構成要素であり、科学者はその存在と特性を信頼しています。
少し難しいですが、Grokなりの深いジョークだったようです。こんな使い方も面白いですね!
最新のバズポストを探してみる
Grokの最新情報の収集能力を確認するため、最新のバズポストを探してもらいました。「Tell me the most buzzing post right now.(今もっともバズってるポストを教えて)」と聞いてみます。
日本語訳「今最も賑やかな投稿は、オールダムアスレチックメディアの待望の発表についてのDJケブ・ウィリアムズ(@WilliamsKevin)のツイートです。この投稿はファンから多くの注目と興奮を集めており、多くの人が大きな公開を熱心に待っています」
バズツイートを指定して教えてくれました。しかし実際に見てみると、そこまでバズっていないツイートのようです。
確かに最新の情報を引っ張ってはくれますが、その信憑性はまだまだ薄いようですね!
今日の日経平均を聞いてみる
さらに日本の最新情報も確認してみます。現在の日経平均について聞いてみました。
日本語訳「日経225は、日経株価指数とも呼ばれ、東京証券取引所(TSE)の株式市場指数です。この指数は価格加重され、TSEのファーストセクションにリストされている上位225の優良企業が含まれています。2024年1月25日現在、東京証券取引所から入手可能な最新のデータである日経225指数は、前日の終値から1.3%上昇した63,567.73で終了しました。投資家が日本経済とトップ企業の業績に自信を示し続けているため、これは指数の史上最高値をマークします。今日のインデックスのトップパフォーマーには、ソニーグループ株式会社(6758)、三菱株式会社(8058)、トヨタ自動車(7203)などがあり、株価は2%以上上昇しました。株式市場の状況は急速に変化する可能性があることを覚えておくことが重要です。投資の決定を下す前に、最新の動向を把握し、ファイナンシャルアドバイザーに相談することをお勧めします」
日経平均の最新情報を出力してくれました。しかし、実際に調べてみると数字や内容にはズレがありました。やはりまだまだ情報の精度は低いようです。
画像を生成してみる
Grok-2ではテキストから画像生成ができるようになりました。実際にやってみましょう。今回は「かわいい猫が大空を羽ばたいている画像を生成してください。」とプロンプト入力しました。
適切な画像が生成されていますね!もう少し羽ばたいている感じを出したいので、「羽をはやしてください」と追加でプロンプト入力してみます。
猫の種類が変わったように見えますが、追加した内容を反映してくれました。生成した画像がイマイチの場合は、プロンプト入力で変更することもできますが、再生成ボタンを使うことも可能です。再生成ボタンを押した画像は以下です。
今後は生成された画像を編集できる機能が搭載される予定とのことです。他にも便利な機能が追加される可能性もあるため、Grokの最新情報は要チェックですね。
なお、Grokの活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。
進化するGrokの活用でユーモアのある投稿が増える
Grokは、イーロン・マスク氏率いるxAI社が公開した最新のAIモデルで、全人類に最大限の利益をもたらすAI ツールを目指して開発が続けられています。
Grokは他の一般的なLLMとの違いは、ユーモアのある回答をし、時に反抗的な態度をとることができるため、Xのような文章をメインとするSNSとの相性が抜群です。しかし現状はベータ版のため、まだまだ情報の精度が低かったり、日本語対応できない場面も多いようです。
Grokを動かしているGrok-1は、少ないリソースと短期間でトレーニングされたにも関わらず、ベンチマークでGPT-3.5を超える性能を示しており、xAIの卓越した効率のトレーニングの結果と言えます。
また、ベータ版のGrok-2はベンチマークでGPT-4 Turboを上回る性能を出しているため、xAI社の技術力は非常に高いと言えるでしょう。特に画像生成機能は提供されて日が浅いため、多くの利用者が使っていくことでより性能が向上し、より使いやすくなっていくはずです。
今後は、よりモデルの安全性を追求するとともに、様々な形式の入出力に対応したマルチモーダルモデルとして進化させていくようです。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
「Grok」の日本展開は、生成AIの未来を形作る可能性を秘めています。自社の課題を解決する新たな可能性を、この革新技術を通じて探求してみてください。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。