Gemma 3nとは?特徴・使い方・ChatGPT 4oとの違いを試して解説

- 軽量・高性能モデル
- マルチモーダル対応
- 140越えの言語に対応
2025年5月21日、Googleから新たなAIモデルが登場。
今回リリースされた「Gemma 3n」は軽量かつマルチモーダル対応のAIモデルで、軽量ながら優れた性能を発揮します。本記事では、Gemma 3nの概要から特徴、使い方を解説します。
ぜひ最後までお読みください。
Gemma 3nとは?
Gemma 3nは、Googleが開発した軽量・高性能なオープンソースAIモデルであり、スマートフォンやタブレットなどのオンデバイス実行に最適化。Gemini Nanoと同じ基盤技術を使用し、「日常のデバイス上で動作するリアルタイムAI体験の実現」を目指して設計されたAIモデルです。
主にスマートフォン(Android)やノートPC、エッジデバイスなどのローカルでの音声認識・翻訳、テキスト生成、画像解析などに用いられます。
Gemma 3nの立ち位置的には、Gemma 3をスマホで使用できかつリアルタイムAI、という感じです。※1
特徴的なのは、「Per-Layer Embeddings (PLE)」という技術を用いており、メモリ使用量を大幅に削減。

Gemma 3nでは、上記のようにデータをキャッシュしたり、使わない部分を非アクティブにすることで、高品質・高速・省メモリ動作を実現しています。
Gemma 2B / 7B / 3nの違い
Gemma 3nは、スマホ・エッジデバイスでのローカル動作を前提に設計されたAIモデルで、主な特徴は次の4つです。
- スマホでオフライン実行が可能
- 画像や音声も理解できるマルチモーダル
- 「MatFormer」+「PLE」技術でRAM使用量を半分以下に最適化
- ベンチマークではGPT-3.5クラスと同等の性能も記録
またGemma 2B / 7B / 3nの違いは以下のようになっています。唯一マルチモーダルに対応しているのがGemma 3nです。
モデル名 | パラメータ数 | モダリティ | 実行環境 | 主な用途 |
---|---|---|---|---|
Gemma 2B | 約2B | テキストのみ | クラウド・PC | テキスト生成、チャットボット |
Gemma 7B | 約7B | テキストのみ | 高性能GPU推奨 | 文章生成、RAG、分析業務 |
Gemma 3n | 約2B~4B | テキスト・画像・音声 | モバイル・ローカル | スマホ上でのテキスト・画像・音声生成 |
軽量かつInstruct対応モデルの背景
軽量かつInstruct対応モデルが登場・普及してきた背景には、AIの民主化と実運用での現実的な要件が影響しています。
GPT-3やGPT-4に代表される大規模言語モデルは、高性能ですがその分計算資源・コストが非常に高いです。
一方で計算資源やコストが非常に高いと個人での使用が難しいという面もあります。
(本メディアでも実装の難しいモデルを過去にいくつかご紹介をしました。例えばQVQ-72B-Preview)
また、さまざまな企業からいくつものモデルが登場していますが、どのモデルも性能としては似通っているため次第に、「いかに高性能で軽量にできるか」という点にフォーカスされていると考えられます。
その点、今回Googleから発表されたGemma 3nは、「軽量 × マルチモーダル × Instruct」という個人ユーザーが待ち望んでいたモデルと言えるのではないでしょうか。
- モバイル対応(2GB〜3GBで稼働)
- テキスト+画像+音声の多様な入力
- Instruction tuning済(E2B-it / E4B-it)
- 商用利用可能なオープンでの提供
Gemma 3n-E4B-it-litert-previewとは?
Gemma 3n-E4B-it-litert-preview は、Googleが2025年5月に公開した次世代LLM「Gemma 3n」シリーズの中でも、特定用途に最適化されたプレビュー版です。特徴としては下記です。
- 指示応答対応
自然言語での指示に適切に応答するように調整。チャットボットやAIアシスタントに向いていると言えます。 - モバイル・エッジ最適化
LiteRT対応により、スマートフォンやエッジデバイスでの高速・軽量推論が可能。 - マルチモーダル入力対応
テキストに加えて画像も入力として処理可能 - 量子化済み
プレビュー版はdynamic_int4という4ビット量子化モデル。メモリ使用量を大幅に抑えつつ、応答精度を一定以上に保つ工夫がされています。
Gemma 3nの特徴と強み
Gemma 3nの特徴とはしては、非常に少ないパラメータ数で高い性能を発揮している点。

また、Gemma 3nは日常のデバイス上で動作するリアルタイムAI体験の実現を目指して開発されているので、応答速度は重要になります。

上記の画像はGemma 3nの推論速度とメモリ使用量です。「Time to first token(sec)」が初期応答までの時間です。CPUえ約9秒、GPU使用で約15秒という結果になっています。
ぱっと見ではCPUを使った方がリアルタイム性としては性能がいいのかなと思いますが、これは一問一答などの場合はCPUに軍配が上がると考えられます。
GPUではモデルのロードに時間がかかるため、Time to first tokenで時間がかかっていますがDecode速度はGPUの方が高速です。Decode速度は生成中のトークン生成速度になるので、複数回のやり取りなどをする場合には、GPUに軍配が上がります。




そのほかのベンチマークを上記に記載していますが、HumanEvalやMBPPのスコアからコード生成に強いのかなと考えられます。
また、BoolQ、ARC-e、DROPなど推論・論理ベンチマークも高いスコアを出しているので、推論も得意と言えそうです。
Gemma 3nのライセンス
Gemma 3nのライセンスはGemma Terms of Useに基づいています。
商用利用や私的利用は可能で、改変も可能ですが、モデルの改変・派生モデルの作成時には改変したことを明示する必要あります。
利用用途 | 可否 |
---|---|
商用利用 | ⭕️ |
改変 | ⭕️ |
配布 | ⭕️ |
特許使用 | 不明(明記なし) |
私的使用 | ⭕️ |
なお、Google発の最先端テキスト拡散モデルGemini Diffusionについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

Gemma 3nの使い方
Gemma 3nは現在(2025/05/23時点で)早期プレビューとして使うことができます。Google AI StudioとGoogle AI Edgeで利用可能。

APIで使えるか探してみましたが、見つからなかったのでAPIの利用はまだできないと思います。
また、Google AI Edge Galleryを使えばAndroidスマホでGemma 3nを試すことが可能。

最新版のai-edge-gallery.apkをダウンロードして開く→インストールでOKです。初めて使用する場合にはHugging Faceへのログインが必要ですが、画面に沿って進めていけば大丈夫です。※2
実際にGemma 3nを使ってみた
実際にGemma 3nに以下のプロンプトを投げて、ChatGPT 4oと反応を比較してみます。
プロンプトはこちら
「AIを活用した新しいエンターテイメントを、具体例を挙げて1つ教えてください。」
「量子コンピューターを小学生にもわかるように説明してください。」
「AIの倫理問題について、重要な点を3つ挙げてください。」
「地球温暖化の主な原因は何ですか?簡潔に教えてください。」
【Gemma 3n】AIを活用した新しいエンターテイメントを、具体例を挙げて1つ教えてください。の結果はこちら
AIを活用した新しいエンターテイメント:AI生成映画「The Henry Machine」
概要:
AIが完全に脚本、撮影、編集まで手掛ける世界初の長編映画「The Henry Machine」は、AI技術の可能性を体現した革新的なエンターテイメントです。
具体的な内容:
脚本生成: AIが、これまでにない独創的なストーリーを生成します。人間の脚本家が最初に入念な指示を出すことで、AIはそれに基づいて物語を展開していきます。
映像生成: AIが、物語の内容に合わせて、高品質な映像を生成します。既存の映像素材を組み合わせるのではなく、AIが新たに画像を生成する点が特徴です。
音声生成: AIが、登場人物のセリフや効果音、音楽などを生成します。声優の演技を模倣したり、物語の雰囲気に合わせたオリジナル音楽を作ったりすることも可能です。
編集: AIが、生成された映像、音声、音楽などを組み合わせて、映画を編集します。
エンターテイメントとしての魅力:
予測不可能性: AIが生成するため、従来の映画とは異なる、予測不可能な展開が楽しめます。
革新的な映像体験: AIが生成した映像は、現実世界とは異なる、幻想的で美しい世界観を作り出します。
AI技術への興味喚起: AIが映画制作に関わっていることを知ることで、AI技術への興味を喚起し、新たな可能性を示唆します。
新たな創作の可能性の開拓: AIが映画制作のプロセスの一部を担うことで、人間のクリエイターはより創造的な作業に集中できるようになります。
参考情報:
https://www.youtube.com/watch?v=xWJ9yJjXgT4
将来性:
「The Henry Machine」は、AIを活用したエンターテイメントの先駆けとなる作品です。今後、AI技術の進化に伴い、映画だけでなく、ゲーム、音楽、アニメーションなど、様々な分野でAIが活用されることが期待されます。
この映画はまだ実験的な段階ですが、AIがエンターテイメント業界にもたらす可能性を強く示唆しており、今後の発展が注目されています。
【ChatGPT 4o】AIを活用した新しいエンターテイメントを、具体例を挙げて1つ教えてください。の結果はこちら
AIを活用した新しいエンターテインメントの具体例として、「\*\*AI即興対話劇場(AI Improvised Theater)」を挙げます。
---
### **AI即興対話劇場(AI Improvised Theater)**
#### 概要:
観客の入力や投票によってリアルタイムでストーリーが生成される、**インタラクティブなAI演劇**。複数のAIキャラクターが登場し、それぞれが異なる性格や目標を持って即興で会話を展開する。演出やストーリーの進行はAIによって動的に調整され、毎回異なる物語が生まれる。
#### 具体的な仕組み:
1. **キャラクター設計**
各AIキャラクターには性格(例:楽天家、皮肉屋、論理主義者)や目的(例:秘密を守る、恋愛を成就させる)が事前に設定されており、プロンプト設計によって振る舞いが個性化されている。
2. **観客参加型システム**
・観客がスマホやPCで選択肢を選ぶ(「Aを告白させる」「Bを裏切らせる」など)
・AIはその選択に基づいて会話や行動を生成し直す。
3. **生成内容**
・セリフ、表情、動き(モーションキャプチャやアバター制御)をリアルタイムで生成
・物語はプロンプト工学+RAG技術により一貫性を保ちつつ展開
4. **活用技術**
* LLM(大規模言語モデル)による自然な会話生成
* Text-to-Speech + 顔アニメーション合成
* UnityやUnreal Engineとの連携でバーチャル舞台を構築
* クラウド上で複数人が同時参加
#### 想定されるエンタメ形式:
* バーチャル演劇配信(例:YouTube LiveやTwitch)
* メタバース内での上演
* AR/VR空間での観劇
* ショッピングモールなどでのイベント型上映
#### 社会的・商業的インパクト:
* 台本なしでも上演が可能 → コスト削減と多様性のある体験
* 子供向け教育演劇、企業向け研修ドラマとしても展開可能
* IP(知的財産)の自動生成が促進され、新たなキャラクターや物語が量産される
---
このように、「AI即興対話劇場」は生成AIの特性(即興性・対話性・個性のモデリング)を活かした**完全に新しい没入型エンタメ体験**であり、技術的な実現性と商業展開のポテンシャルを併せ持っています。
【Gemma 3n】量子コンピューターを小学生にもわかるように説明してください。の結果はこちら
はい、承知いたしました。量子コンピューターを小学生にもわかるように説明しますね!
普通のコンピューターと量子コンピューターの違い
まず、みんなが普段使っているコンピューター(スマホ、パソコンなど)のことを考えてみよう。
普通のコンピューターは、情報を「0」か「1」のどちらかで表現するんだ。これは、電気のスイッチが「オン」か「オフ」の状態みたいだね。この「0」と「1」を組み合わせて、色々な計算をしているんだよ。
一方、量子コンピューターは、もっとすごい仕組みを使っているんだ。
量子コンピューターのすごいところ:重ね合わせと量子もつれ
量子コンピューターは、「0」と「1」の状態を同時に表現できるんだ!これは、電気のスイッチが「オン」と「オフ」の状態を同時に持っているようなものかな。これを「重ね合わせ」って言うんだ。
そして、量子コンピューターには、**「量子もつれ」**っていう、とっても不思議な現象があるんだ。これは、2つの「0」と「1」が、どんなに離れていても、お互いに影響し合うようになることなんだ。まるで、魔法みたいだね!
量子コンピューターは何ができるの?
この「重ね合わせ」と「量子もつれ」のおかげで、量子コンピューターは、普通のコンピューターでは難しい問題を、すごく速く解ける可能性があるんだ。
新薬の開発: 新しい薬を開発するのに、たくさんの実験が必要だけど、量子コンピューターを使えば、その実験をコンピュータ上でシミュレーションできるから、時間やお金を節約できるかもしれない。
暗号の解読: 今使っている暗号を解読するのも、量子コンピューターが得意なんだ。
天気予報: もっと正確な天気予報をできるようになるかもしれない。
新しい素材の開発: 新しい素材を開発するのに役立つかもしれない。
まだ発展途上
量子コンピューターは、まだ開発途上なんだ。でも、将来は私たちの生活を大きく変えるかもしれない、すごい技術なんだよ!
まとめ
普通のコンピューターは「0」か「1」で情報を表現する。
量子コンピューターは「0」と「1」を同時に表現できる「重ね合わせ」と、「量子もつれ」という不思議な現象を使う。
量子コンピューターは、新薬開発、暗号解読、天気予報など、色々な分野で活躍する可能性がある。
どうかな?少しは量子コンピューターがどんなものか、わかったかな? 😊
【ChatGPT 4o】量子コンピューターを小学生にもわかるように説明してください。の結果はこちら
はい、小学生にもわかるように、**量子コンピューター**について、できるだけやさしく説明します。
---
### 💡 まず「ふつうのコンピューター」って何?
ふつうのコンピューター(スマホやパソコン)は、「0」か「1」のどちらかでしか考えられない電気のスイッチ(=**ビット**)をたくさん使って、計算やゲームをしたり、インターネットを見たりしてるんだ。
たとえば:
* 電気が流れてない → 「0」
* 電気が流れてる → 「1」
これをたくさん組み合わせて、いろんなことをしてるのが今のコンピューター。
---
### 🔮 じゃあ「量子コンピューター」って?
量子コンピューターは、「**ふしぎな粒(つぶ)**」=量子(りょうし)っていう、とーっても小さな世界のルールを使ったコンピューターなんだ。
この世界では、スイッチが「0」か「1」かだけじゃなくて、\*\*「0でもあり、1でもある」\*\*という状態(=**重ね合わせ**)になることができるんだよ!
---
### 🎩 たとえるなら…
ふつうのコンピューターは、
> 「コインを投げたら、“表”か“裏”のどちらかになるよね」
でも量子コンピューターは、
> 「コインが\*\*空中でくるくる回ってて、“表”と“裏”がまざってる”\*\*状態で使える」んだ!
この「まざってる状態」で計算するから、**とてもむずかしい問題を、いっきに計算する力**があるんだ。
---
### 🌈 どんなことができるの?
量子コンピューターはまだ開発中だけど、こんなことができると考えられてるよ:
* すごく大きな迷路を、一発でゴールまで見つけられる
* お薬を作るのに、とてもむずかしい分子の計算ができる
* 今のコンピューターでは何千年もかかる問題を、すごく速く解けるかも!
---
### 🧠 まとめ
| ふつうのコンピューター | 量子コンピューター |
| ------------- | ---------------- |
| 「0」か「1」だけで考える | 「0と1がまざった」状態も使える |
| 順番に調べる | 一気にたくさん調べられる |
| すでに使われてる | 研究中で、すこしずつできてきた |
---
「まほうのコインを使って、ふしぎな計算をするスーパー頭のいいコンピューター」
それが**量子コンピューター**です!
---
もっと知りたい? 他の例えや動画も紹介できます。
【Gemma 3n】AIの倫理問題について、重要な点を3つ挙げてください。の結果はこちら
AIの倫理問題は非常に複雑ですが、重要な点を3つに絞って説明します。
バイアス(偏り)の問題:
内容: AIは学習データに基づいて判断を行います。もし学習データに偏り(例えば、特定の性別や人種に偏っているデータ)が含まれていると、AIもその偏りを学習してしまい、不公平な判断をしてしまう可能性があります。
具体例: 採用選考AIが、過去の採用データに基づいて男性ばかりを選んだり、顔認識AIが、特定の人種を認識しにくいといったケースです。
なぜ重要か: AIの判断が偏っていると、差別や不利益が生じ、社会的な不公平を助長する可能性があります。
説明責任(透明性)の問題:
内容: AI、特に深層学習(ディープラーニング)のような複雑なAIシステムは、なぜそのような判断をしたのか人間には理解しにくいことがあります。これは「ブラックボックス」と呼ばれる現象です。
具体例: 自動運転車が事故を起こした場合、なぜそのような判断をしたのか、誰が責任を負うのかが明確でない場合があります。
なぜ重要か: AIの判断が不明瞭だと、問題発生時の原因究明や責任の所在が曖昧になり、信頼性を損なう可能性があります。また、公平な判断がなされたかどうかの検証も困難になります。
雇用の喪失の問題:
内容: AIと自動化技術の発展により、単純労働や事務作業など、多くの仕事がAIに代替される可能性があります。
具体例: 工場でのロボット化、コールセンターでのチャットボット導入、事務作業のRPA導入などです。
なぜ重要か: 雇用の喪失は、失業者の増加や格差の拡大につながり、社会不安を引き起こす可能性があります。 AIの導入による経済的な利益を、どのように社会全体で分配していくかという問題も重要になります。
これらの問題は相互に関連しており、一つの問題解決のためには、他の問題も考慮する必要があります。AIを倫理的に利用するためには、これらの問題に対する意識を高め、適切な対策を講じることが重要です。
【ChatGPT 4o】AIの倫理問題について、重要な点を3つ挙げてください。の結果はこちら
AIの倫理問題について、特に重要な点を以下の3つに整理できます。
---
### 1. **バイアスと差別の再生産**
#### 概要:
AIは過去のデータを学習して判断しますが、そのデータに偏り(バイアス)があると、**差別的な結果を出す**危険があります。
#### 例:
* 採用AIが、過去の男性中心のデータを学習したことで、女性の応募者を不利に扱う
* 顔認識AIが、特定の人種を誤認識しやすくなる
#### なぜ重要か:
社会的に公平な判断が求められる場面(採用、融資、司法など)で、偏ったAIの判断が**差別を正当化する道具**になるおそれがあるため。
---
### 2. **説明責任(アカウンタビリティ)と透明性**
#### 概要:
AIがなぜそのような判断をしたのかが分からない「ブラックボックス問題」が存在します。これにより、**責任の所在があいまい**になります。
#### 例:
* 医療AIが誤った診断をしたとき、医師、開発者、企業の誰が責任を取るのか不明瞭になる
#### なぜ重要か:
人間の命や生活に影響を与えるAIが、**理由を説明できず責任も取れない**場合、信頼性を損なうだけでなく、誤った判断による被害が拡大するため。
---
### 3. **プライバシーと監視社会の危険性**
#### 概要:
AIは大量の個人情報を使って学習・分析を行いますが、その過程で**プライバシーが侵害される**危険があります。
#### 例:
* 顔認識カメラが街中に設置され、個人の移動履歴や行動が追跡される
* チャットや音声の内容から個人の性格や趣味をAIが推定する
#### なぜ重要か:
便利さの裏で、**人々が自由に行動・発言しにくい社会**になる可能性があり、民主主義や人権に影響を与えるため。
---
### 補足(共通する前提):
* AIは「中立な機械」ではなく、人間の価値観が反映された「社会的存在」として扱うべきです
* 倫理的な設計・運用(AI倫理ガイドライン)と、それをチェックする**法制度や第三者機関の整備**が欠かせません
---
これら3点は、AIが人間社会に深く入り込む時代において、技術開発者・企業・政策立案者・一般市民すべてが共有すべき重要な視点です。
【Gemma 3n】地球温暖化の主な原因は何ですか?簡潔に教えてください。の結果はこちら
地球温暖化の主な原因は、人間活動による温室効果ガスの排出増加です。特に、以下のものが大きいと考えられています。
化石燃料の燃焼: 石炭、石油、天然ガスなどを燃やすことで、二酸化炭素(CO2)が大量に排出されます。
森林破壊: 森林はCO2を吸収する役割がありますが、森林破壊によってその機能が失われ、CO2が大気中に放出されます。
工業プロセス: セメント製造など、特定の工業プロセスからもCO2やその他の温室効果ガスが排出されます。
農業: 農業活動からも、メタンや亜酸化窒素などの温室効果ガスが排出されます。
これらの温室効果ガスが大気中に増えることで、地球から宇宙へ逃げる熱が閉じ込められ、地球の平均気温が上昇しています。
【ChatGPT 4o】地球温暖化の主な原因は何ですか?簡潔に教えてください。の結果はこちら
地球温暖化の主な原因は、\*\*人間の活動によって排出される温室効果ガス(特に二酸化炭素CO₂)\*\*です。
---
### 主な原因の3つ:
1. **化石燃料の使用**
車や工場、発電所などで石油・石炭・天然ガスを燃やすことでCO₂が大量に発生します。
2. **森林破壊**
木を切るとCO₂を吸収する力が減り、大気中のCO₂が増えます。
3. **畜産やごみの処理**
牛のげっぷやごみの分解からメタンなどの温室効果ガスが出ます。
---
これらによって地球の空気が「熱をためこみやすく」なり、地球全体の気温が上がっています。
以上がChatGPT 4oとGemma 3nに同じ質問を投げた結果です。結果を見比べてみると、遜色ないようにも見えます。Gemma 3nの日本語の対応も適切にできており、生成速度も4oと大差ありませんでした。
もしかしたらもっと複雑かつ推論が必要な問題で差が出るのかもしれませんが、今回のような質問では大きな差は認められません。
なお、スマホでも動く!Stable Audio Open Smallについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

Gemma 3nの課題
ChatGPT 4oと出力結果を比較したところ、そこまで大差がないように感じましたが、Gemma 3nとしての課題はまだ残されています。例えば、現状ではまだPreview版であり、PyTorchでの直接推論・ファインチューニングができず、モデルの拡張や微調整が難しい点。
また、本記事執筆時点(2025/05/23)ではまだチェックポイントがテキストと画像入力のみという点も課題です。
The current checkpoint only supports text and vision input. We are actively working to roll out full multimodal features and are collaborating with open-source partners to bring Gemma 3n to the open-source community in the coming weeks.
https://huggingface.co/google/gemma-3n-E4B-it-litert-preview
日本語訳:現在のチェックポイントでは、テキストと視覚入力のみをサポートしています。我々は、完全なマルチモーダル機能を展開するために積極的に取り組んでおり、今後数週間のうちにGemma 3nをオープンソースコミュニティに提供するために、オープンソースパートナーと協力している。
あとはプレビュー版のため、何度も繰り返し使っていると回答出力の不安定さなどが気になってくるかもしれません。
まとめ
本記事ではGemma 3nの概要から使い方、ChatGPT 4oとの比較結果を解説しました。スマホで使えるほどの軽量モデルかつ高性能であるのは非常に魅力的です。
一方で本格リリースに向けてまだまだ課題は山積みでもあるように感じます。今後のアップデートでどのくらい使いやすく・活用の幅が広がるのかが楽しみです。
最後に
いかがだったでしょうか
業務効率化や現場でのリアルタイムAI活用を模索されている企業様にとって、「Gemma 3n」のような軽量×マルチモーダルモデルは、自社プロダクトへの組み込みやスマホ上でのAI導入に大きな可能性をもたらします。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。