Gemini(旧Google Bard)で画像生成はできる?画像機能の活用方法含め解説
Google Bardは、2024年2月にサービス名を変更して「Gemini」になったのをご存知ですか?
Geminiは、Google Bardから名前を変更したものなので同じものです。。Geminiは、ChatGPTに引けを取らない優れた精度を有しており、Googleが提供している各サービスとの連携もできます。この記事ではGeminiの持つ可能性や画像認識機能を使った活用方法、他5つの画像生成AIを解説し、私たちの創造性や日常生活を豊かにする方法を具体的に説明しています。
最後まで読むとGeminiや画像生成AIの理解が深まり、より効果的な画像生成AIを使いこなせるようになるので、参考にしてください。
なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。
Gemini(旧Google Bard)とは
Geminiを簡単に説明するならば、Googleが開発したChatGPTのような生成AIです。Googleが持つ膨大なデータベースとインターネット上の情報を活用し、日常的な質問から専門的な知識に至るまで幅広く対応可能なLLMです。
Geminiの最大の強みは、Google Workspaceとの連携(Gemini for Google Workspace)があげられます。私たちが日常的に利用しているGoogleマップ・Gmail・他GoogleサービスとBardを連携できるのはGoogleならではの強みと言えるでしょう。
例えば下記画像のようにGeminiに向かって「仕事のメールを検索してほしい」と質問すればあなたのGmail情報にアクセスし、Gmailボックスから該当するメールを探してきてくれます。
なお、Geminiの使い方について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→10分で分かるGoogle Gemini日本語版の使い方解説!最新活用事例10選も紹介
有料プランGemini Advancedが追加
Geminiにもついに有料プランが追加されました。その名も「Gemini Advanced」です。Gemini Advancedでは、Gemini Ultra1.0が利用できます。Gemini Ultraとは、GPT-4より性能が良いと評判のマルチモーダル生成AIです。
しかし、Geminiは日本語での画像生成ができません。Geminiでの画像生成は、英語にしか対応していないため、日本語で作成したい場合は違う生成AIを使用することをおすすめします。
このツールの使用料金は、月2900円でChatGPT Plusより少しだけ安く利用可能です。
Geminiでも画像生成が可能に
2024年2月2日、ついにGemini(旧Google Bard)にも画像生成機能が追加されました。
今回のアップデートで「Imagen 2」というモデルが追加。日本からも利用可能ですが、2024年2月2日現在ではプロンプト入力は英語のみなので、日本語入力に対応していないという点には注意しましょう。
Geminiの能力はテキストベースの情報提供に特化しており、Googleが持つ豊富なデータベースを活用することで、様々な質問に対して高度なリアルタイム回答が可能です。
ChatGPTと比べて質問に対しての回答結果が早いのも特徴的。さらに、今回の画像生成機能の搭載により、生成できるコンテンツの幅が格段に向上しました。
また、Adobe Fireflyから正式にGeminiと提携するとの旨が2023年5月11日に発表されています。
Adobe FireflyはAdobe社が開発した商用利用も可能な画像生成AIです。Adobe Fireflyは無料と有料のプランがあり、アカウント登録さえすれば、誰でも無料で利用できます。(無料プランの場合生成した画像にAdobeのロゴが表示されたり、1ヶ月に25回の生成などの制約がある)
Geminiと提携した場合、どのような料金体系となるのかも気になるところですが、無料で使えるのか2024年2月2日時点では不明です。
参考記事:Google Bardとの連携により、数百万人のGoogleユーザーのもとに Adobe FireflyとAdobe Expressを
なお、Adobe Fireflyについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Adobe Firefly】商用利用可・著作権問題なしの画像生成AI!使い方、料金体系を徹底解説
Gemini(旧Google Bard)で画像生成を利用する方法
Geminiで画像を生成するには、特に特別な操作は必要ありません。ただし、前述のとおりプロンプトの日本語入力は非対応なので、英語でプロンプトを入力する必要があります。
英語が苦手な方は難しそうに感じるかもしれませんが、Geminiに翻訳を頼めばすぐに英語に変換できます。
例えば、「浜辺で鬼が豆まきしている画像を作って を英語にしてください」と指示し、出力された英語を入力したところ下記の画像が生成されました。
この通り、問題なく条件を満たしたイラストが生成されるので、英語が苦手な方でも問題なく利用できます。
また、一度に2枚ずつ生成されるので、他のパターンが欲しい場合は、生成された画像の下の「さらに生成」をクリックすることで新たな画像を生成できます。
Gemini(旧Google Bard)の画像生成機能の活用方法
Geminiは画像生成機能だけではなく、画像入力や画像認識も可能です。この機能によって、買い物や調べものをサポートし日常生活を便利にすることができます。この項目ではGeminiを使った画像機能の活用法を紹介します。
①画像の調査・分析
Geminiの画像調査・分析機能は、画像に含まれる情報を深く理解するのに役立ちます。画像内の物体や風景、または人物を識別し、それに関連する詳細な情報やデータを出力して私たちが求めている回答へと導いてくれます。
画像分析は、研究やマーケティング、教育など多様な分野での応用が期待されているのです。例えば、市場調査では商品画像を分析して消費者の嗜好を調査するのに使用し、教育では画像を通じて歴史や科学の授業がわかりやすくなります。
②画像から買い物や調べものをサポート
Geminiの画像機能を使えば、買い物や調べものがより便利なものへと変わります。所持しているベースの写真を撮ってGeminiに聞いてみましたが、モデル名まで当ててくれました。
この機能を使えば、自分が気に入った家具や服の画像をGeminiにアップロードして、類似の商品をオンラインで検索することが可能です。ほかにも、購入オプションを提示したり、旅行先の風景写真からその場所の情報を得たりできます。。
さらに、レストランの料理写真をアップロードすると、その料理のレシピを見つける情報を見つけてくれるでしょう。Geminiの画像入力・認識は日常生活において便利なサポートを提供します。
③プロンプトの提案
Geminiでは、画像をアップロードして、それに類似した画像を生成AIで作成する際のプロンプトの提案も可能です。
たとえば、下記画像のように景色の写真をアップロードしGeminiに「この画像のような景色を生成するプロンプトを作って」と質問すると、渡した画像と似たような場所・画像の提案を回答してくれます。
Geminiからの回答からは下記のような提案・アドバイスが返ってきました。
また、「あなたが提案してくれたスタイルで新しく画像を作りたいので、プロンプトを提案してください」というプロンプト文をGeminiに投げれば、アップロードした画像に基づいた新しいデザインを生成してくれます。
この機能により、新しいインスピレーションを得たり、自分自身では考えつかなかったような使い方をGeminiで見つけたりすることも可能です。
④画像の生成
Geminiの利用規約を確認しましたが、商用利用禁止の文言はなく、生成AIの追加利用規約には「本サービスで提供されるコンテンツについては、ご自身の裁量で依拠、公開、利用してください」とありました。
上記観点から、商用利用についても問題ないと思われます。そのため、Geminiの画像生成機能を利用しアイコンの作成や広告・バナーのデザイン生成など、幅広いシーンで利用できます。
しかし、商用利用が可能だからといって生成されたすべての画像を安易に利用すると、著作権の侵害につながる可能性があるので注意が必要です。
なお、Geminiのおすすめ活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Google Geminiのおすすめ活用事例】GPT-4超えAIの仕事が鬼捗る使い方10選
Gemini(旧Google Bard)以外の画像生成AI
画像生成AIには、Gemini以外にも高精度なAIがいくつも存在します。OpenAIのDALL-E3やAdobe Fireflyなど、創造的な画像生成で注目されています。それぞれ詳しく解説していくので、ご覧ください。
Adobe Firefly
Adobe Fireflyは、Adobeが独自に開発した生成AIモデルを採用し、PhotoshopやIllustratorといったAdobe製品に統合されておりデザイン業界で活用されています。
Adobe Stock上の画像・著作権切れコンテンツ・オープンライセンスなどの権利関係が明確な画像のみを利用し、著作権に配慮した学習を行っているため、安心して商用利用できる点も特徴です。
今後Geminiに提携されれば、より身近な存在になるでしょう。
Stable Diffusion
Stable Diffusionは、潜在拡散モデルと呼ばれる独自技術を用いた画像生成AIです。
潜在拡散モデルは、画像を低解像度のノイズから徐々に高解像度に生成していく方法です。この潜在拡散モデルで画像を生成しながら、テキストの意味を反映させていくように学習させています。
Stable Diffusionは、人物のリアルな生成が強みでもあり、マッチングアプリのオタ恋の広告はStable Diffusionを使って生成されているようです。
Bing Image Creator
Bing Image Creatorは、MicrosoftのBing検索エンジンとOpen AIのDALL-E3が統合された画像生成AIです。
Bing Image Creatorの最大の特徴は、本来ChatGPT PlusやDALL-E3は月額課金前提のサービスなのですが、マイクロソフトのアカウントさえあれば無料で利用できる点にあります。
1日のうちに15回といった制限はあるものの、無料でここまで高精度なAIが利用できるのは驚きです。
Midjourney
画像生成AIとして日本で最初に注目され始めたMidjourneyですが、他の画像生成AIと比較して、独特の芸術的なアプローチが特徴です。
Midjourneyは特に、抽象的な概念や複雑なアイデアを視覚化する能力に優れており、アーティストやデザイナーに新しい創造的なインスピレーションが生まれやすいとも言えるでしょう。
他のAIよりも芸術的な側面に重きを置いており、その結果、非常に個性的かつ創造的なビジュアルを生み出せる画像生成です。
CanvaAI
CanvaAIは、人気のデザインツールCanvaに統合された直感的でユーザーフレンドリーな画像生成AIです。自分のアイデアやビジョンに合ったカスタマイズ可能なテンプレートや画像を瞬時に生成できます。
ビジネスプレゼンテーション、マーケティング用の素材、教育の資料など、CanvaAIは幅広い用途に対応し、デザインのプロセスを大幅に効率化できるでしょう。
なお、 Canva GPTについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→デザインの作成・編集ができるGPTs「Canva GPT」の使い方を解説
Gemini(旧Google Bard)の画像機能を上手に活用しよう!
この記事では、Geminiの活用法や画像生成AIについて詳しく解説してきました。
Google Bardは、2024年2月にサービス名を変更しGeminiとなりました。2月のアップデートにより、画像生成機能が実装され大きく進化しています。さらに、Adobe Fireflyとの提携が決まっている他、画像認識や画像入力も可能です。
各画像生成AIは独自の強みとそれぞれの用途を持ち、クリエイティブな作業やビジネスアプリケーションに革新をもたらしています。今後も画像生成AIの技術の進化に注目し、新たな可能性を見つけていきましょう。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
WEELの生成AIへのスタンス
我々はむやみやたらにAIツールの使用をお勧めしていません。
AIツールでできることはほとんどがChatGPTやStable Diffusionなどの大元のAIサービスで行えるからです。
※国内のAIツールの多くはChatGPTだけでも完結できるソリューションを展開しています。
もし、自社で生成AIを活用したいという場合は
1. ChatGPTをフルで使えるようになる
2. 業務を生成AIに解けるタスクまで分解し、自動化する
のどちらかが良いと思います。
弊社では
1の場合、生成AIセミナーの実施や生成AIコンサルティングなどで、AI専門家による生成AI活用指導
2の場合、PoC開発やソリューション開発などで、LLMエンジニアやAIコンサルタントが御社にあったAIツールの開発を行います。
無料相談にてご相談を承っておりますので、興味がある方は以下からご連絡ください。
→無料相談で話してみる
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。