【Gemini 2.5 Flash-Lite徹底解説】高速・低コスト・高精度！マルチモーダル対応の軽量LLMを使ってみた

2025-06-18

Gemini 2.5 Flash-Lite 高速低コスト高精度マルチモーダル対応軽量LLM

押さえておきたいポイント

Gemini 2.5シリーズの中で最も軽量かつ高速なモデル
処理速度が非常に速いため、大量のリクエストをさばく用途（例：翻訳・分類など）に最適
テキスト・画像・音声・動画を入力として処理可能

2025年6月18日、Google DeepMindから新たなLLMが登場！

今回リリースされた「Gemini 2.5 Flash-Lite」はGemini 2.5モデルの中で最も高速に動作し、最もコストに優れたモデルです。Gemini 2.5 Flash-Liteは翻訳や分類といった大量のリクエストを高速に処理する必要があるタスクに向いています。

🎉 It's a BIG day for Gemini 2.5

— 2.5 Flash and 2.5 Pro are now stable and generally available in AI Studio, Vertex AI, and the @GeminiApp
— We're launching a preview of the new 2.5 Flash-Lite, our most cost-efficient and fastest 2.5 model yet

More info on each model below ⬇️ pic.twitter.com/x3NbSmG5YX
— Google AI (@GoogleAI) June 17, 2025

本記事では、Gemini 2.5 Flash-Liteの概要、性能、実際の使い方について解説をします。本記事を最後まで読めばGemini 2.5 Flash-Liteの理解が深まり、うまく使っていくことができます。

ぜひ最後までお読みください！

＼生成AIを活用して業務プロセスを自動化／

【無料】専門家に相談する

Gemini 2.5 Flash-Liteの概要

Gemini 2.5 Flash-Liteは、Google DeepMindが開発した軽量モデルであり、高速処理とコスト効率を両立したGemini 2.5シリーズの中で最も省リソースなモデル。

**参考：https://blog.google/products/gemini/gemini-2-5-model-family-expands/**

従来の2.0 Flash-Liteと比べて、コード生成や数学、科学、マルチモーダル推論といった各種ベンチマークにおいて一貫して高性能を示しつつ、処理速度も高速です。

最大100万トークンの長文入力に対応し、テキスト・画像・音声・動画といったマルチモーダルにも対応しています。さらに、必要に応じて「Thinking」(推論計算)をオンにすることで、コストや応答時間に応じた使い分けが可能。

また、Google検索やコード実行といった外部ツールとの連携もサポートしており、軽量ながらエージェント的なタスク処理にも対応できます。

Gemini 2.5 Flash-Liteの性能

Gemini 2.5 Flash-Liteは、Gemini 2.0 Flash-Liteの後継として、速度・コスト効率を維持しながら、推論力・多モーダル処理能力を大幅に強化した軽量モデル。

上記のベンチマークを見ると、Gemini 2.5 Flash-LiteはThinkingモードとNon-Thinkingモードで性能が変化することがわかります。

Non-Thinkingモードでも、数学や視覚推論の能力は高いですが、Thinkingモードをオンにすることでより性能が向上していることがわかります。

そのほかのLLMと比較した表が以下です。

**参考：https://lmarena.ai/leaderboard?utm_campaign=hf_banner**

200種類くらいあるLLMのうちGemini 2.5 Flash-Liteは12位となっていて、「o1-preview」よりも性能が高いことがわかります。特にCreative Writingの性能が高いことから、自由度の高い創造的な文章を生成する能力が高いと考えられます。

Gemini 2.5 Flash-Liteの料金

Gemini 2.5 Flash-LiteはGoogle AI StudioもしくはVertex AIで利用可能です。Google AI Studioは無料で利用できます。

**参考：https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-flash-lite**

Vertex AIでは料金がかかります。

スクロールできます

タイプ	価格（100 万トークンあたり）<= 20 万入力トークン	価格（100 万トークンあたり）> 20 万入力トークン	料金（100 万トークンあたり）<= 20 万入力トークン（バッチ API 使用時）	価格（100 万トークンあたり）> バッチ API で 20 万入力トークン
入力（テキスト、画像、動画）	$0.15	$0.15	$0.075	$0.075
オーディオ入力	$1	$1	$0.5	$0.5
テキスト出力（思考なし）	$0.60	$0.60	$0.30	$0.30
テキスト出力（思考 – 回答と推論）	$3.50	$3.50	$1.75	$1.75
100 万トレーニングトークン向けのチューニング	$5.00	$5.00	$2.50	$2.50

なお、Google発の最先端テキスト拡散モデル「Gemini Diffusion」について詳しく知りたい方は、下記の記事を合わせてご確認ください。

WEEL

Google発の最先端テキスト拡散モデル「Gemini Diffusion」特徴・従来LLMとの違い・使い方まで徹底解説！ | … 押さえておきたいポイント最先端のテキスト拡散モデル出力スピードが大幅にUPしており、1,479 tokens/secという高速サンプリングを記録初期リリース段階では、ウェイト…

Gemini 2.5 Flash-Liteの使い方

Gemini 2.5 Flash-LiteはGoogle AI StudioもしくはVertex AIで使うことができますので、今回はGoogle AI Studioで使ってみたいと思います。

まずは簡単な質問をしてみます。簡単な掛け算・割り算、ストロベリー問題をやってもらいます。

どちらも正確に回答できました。掛け算・割り算のみの時に左から計算していくという、適切なアドバイスもできていますね。また、処理速度もかなり速いです。

Gemini 2.5 Flash-Liteの性能を検証

Gemini 2.5 Flash-Liteの性能をいくつかタスクを渡して検証してみたいと思います。今回はGemini 2.5 Proと比較をしてみます。

与えるタスクは次の2つです。Gemini 2.5 Flash-LiteはThinkingモードをオンにして実行します。この後に登場する検証中の動画は向かって左がGemini 2.5 Flash-Lite、右側がGemini 2.5 Proです。

タスク1：小学生にもわかるように、なぜ空は青いのか説明してください
タスク2：雨の日の猫の気持ちになって、短い日記を書いてください

Gemini 2.5 Flash-Liteのタスク1の結果はこちら

こんにちは！空が青く見えるの、不思議だよね。 実は、太陽の光と、私たちの周りにある「空気」が関係しているんだよ。
太陽の光はいろんな色がいっぱい！
太陽の光は、白く見えるけど、本当は虹みたいに、赤・オレンジ・黄色・緑・青・むらさき… っていう、たくさんの色の光が混ざっているんだ。
空気には小さなつぶつぶがある
私たちの地球は、空気という見えない「もの」で包まれているよね。この空気の中には、目に見えないくらい小さな小さな「つぶつぶ」（空気のもとになるもの）がたくさん浮いているんだ。
光がつぶつぶにぶつかると…
太陽の光が地球に届いて、この空気の小さなつぶつぶにぶつかると、光は色々な方向に「パーッ！」と散らばっていくんだ。
青い光は散らばりやすい！
ここで大事なのは、いろんな色の光の中でも、青い光は他の色の光よりも、空気のつぶつぶにぶつかったときに、一番散らばりやすいってことなんだ。
だから空は青く見える！
太陽の光が空気の中を通るとき、青い光がたくさん散らばって、空いっぱいに広がるんだ。その散らばった青い光が私たちの目に入ってくるから、空は青く見えるんだよ。
ちょうど、白いボールに色々な色のペンキを少しずつつけて、壁に投げたとすると、青いペンキだけが壁のあちこちに飛び散って、壁全体が青っぽく見える、みたいな感じかな？
だから、空は青いんだね！

Gemini 2.5 Proのタスク1の結果はこちら

はい、もちろんです！小学生にもわかるように説明しますね。
なぜ空は青いの？
空が青いのは、**「太陽の光」と「空気」**が関係しています。
１．太陽の光は、実は「虹（にじ）の色」のかたまり
まず、太陽の光。お昼の太陽の光は白っぽく見えるけど、実は虹のように、赤、オレンジ、黄、緑、青、紫など、たくさんの色がぜんぶ混ざってできています。
２．空気には、目に見えない「小さなつぶ」がいっぱい
わたしたちの周りにある空気。目には見えないけれど、実はものすごーく小さな**「空気のつぶつぶ」**（チリや分子のこと）がたくさん浮かんでいます。
３．青い光は、ぶつかって広がるのが得意！
太陽からやってきた光が、地球の空気に入ると、この「空気のつぶつぶ」に**「ドーン！」**とぶつかります。
ここで、光の色によって性質がちがいます。
青い光：いちばん散らばりやすい、やんちゃな光。空気のつぶにぶつかると、あちこちへ四方八方（しほうはっぽう）に散らばります。
赤い光：まっすぐ進むのが得意な光。空気のつぶにぶつかっても、あまり散らばらずにまっすぐ進みます。
まるで、青い光はたくさんのボールを一度に投げるみたいに空いっぱいに広がり、赤い光はボーリングの球みたいにまっすぐ進むイメージです。
空いっぱいに青い光が散らばるので、わたしたちがどこから空を見上げても、その散らばった青い光が目に入ります。だから、空は青く見えるんです！
じゃあ、どうして夕焼けは赤いの？
これも面白い質問だよね。
夕方になると、太陽は地平線の近く、ななめの位置にきます。そうすると、太陽の光がわたしたちの目に届くまでに、お昼よりもずーっと長い距離の空気を通らないといけません。
長い旅の間に、やんちゃな青い光は途中でぜんぶ散らばってしまって、私たちのところまで届きません。
最後までまっすぐ進む力のある赤い光やオレンジの光だけが、わたしたちの目に届きます。だから、夕焼けは赤く見えるのです。
まとめ
お昼の空が青いのは…
太陽の光のうち、青い光が空気のつぶにぶつかって、空いっぱいに散らばるから。
夕焼けが赤いのは…
太陽の光が長い空気の層を通るあいだに青い光は届かなくなり、まっすぐ進むのが得意な赤い光だけが目に届くから。
面白いよね！今度、空を見上げたら、「あ、青い光が散らばってるんだな」って思い出してみてね。

Gemini 2.5 Flash-Liteのタスク2の結果はこちら

〇月〇日（雨）
外は、ジャー…ザー…って、うるさい音がしてる。
窓の外は、キラキラした水滴がいっぱいで、なんだか眠くなる匂い。
本当は、お外でチョウチョを追いかけたり、鳥さんの鳴き声を聞いたりしたいのに、今日はダメなんだって。まったく、つまらない日だ。
だから、一番お気に入りのクッションの上で、まるくなってじっとしている。
飼い主さんが、私の頭を優しく撫でてくれた。うん、ゴロゴロしちゃう。
雨の音も、なんだか子守唄みたいに聞こえてきた。
もうちょっとしたら、またお昼寝しようかな。
早く晴れないかなあ。そしたら、また窓辺で日向ぼっこできるのに。
とりあえず、今はここで、あったかくしてるのが一番だ。
ごろごろ…。

Gemini 2.5 Proのタスク2の結果はこちら

あめの日のにっき
きょうは、あめだ。
ざーざー、ぽつぽつ。まどのそとから、いやな音がする。
いつものお庭パトロールに行けないから、つまんない。
ちょうちょも、とかげも、みんな隠れちゃった。
しかたないから、ソファのうえで体をまぁるくして、ねることにする。
ご主人のひざの上も、あったかくていいかもしれないな。
雨の音は、なんだか眠たくなる音だ。
うとうとしてたら、ごはんの夢でも見れるかな。
カリカリ、たくさん食べたいな…。

タスク1も2も出力内容としては大差ないように感じます。

ユーザーが与えたタスクを忠実に遂行するという観点で言えば、両者は同等。ただ、忠実に遂行するのであれば、処理速度は高速なほうが良いのでGemini 2.5 Flash-Liteに軍配が上がるかなと思います。

一方で、Gemini 2.5 Proはタスク1で追加の情報も与えてくれています。ユーザーが与えたタスクを忠実に遂行した上で、補足情報を与えてくれるので、幅広い知識を得ることができるという観点で言えば、Gemini 2.5 Proに軍配が上がります。

まとめるとGemini 2.5 Flash-Liteはタスクを忠実に遂行し、処理速度は高速。

Gemini 2.5 Proはタスクを忠実に遂行し、補足情報を加えてくれるが処理速度はやや劣る、という感じです。

なお、OpenAI史上最高峰の汎用AIモデル「o3-pro」について詳しく知りたい方は、下記の記事を合わせてご確認ください。

WEEL

OpenAI史上最高峰の汎用AIモデル｜o3-proの概要や特徴、使い方を徹底解説 | WEEL 押さえておきたいポイント OpenAI史上最も信頼できる汎用AI 「長く考えるほど精度が伸びる」段階的思考アルゴリズムを採用 200kトークンの巨大コンテキスト 2025年6月11日…

まとめ

本記事ではGemini 2.5 Flash-Liteの概要、性能、使い方について解説しました。Gemini 2.5 Proと同等の結果を出力しつつ、処理速度は高速、コストも安価になっているので、非常に使い勝手の良いモデルだと感じました。

冒頭でも記載しましたが、Gemini 2.5 Flash-Liteは翻訳や分類といった大量のリクエストを高速に処理する必要があるタスクに向いているなという印象です。

ぜひ皆さんも本記事を参考にGemini 2.5 Flash-Liteを使ってみてください！

最後に

いかがだったでしょうか？

翻訳・分類・創造的タスクを、高速かつコスト効率よく実現したい企業様へ。Gemini 2.5 Flash-LiteなどのLLMの導入・活用について、具体的なご提案が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです！

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70％自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80％削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル（LLM）比較レポート