画像を混ぜて新しい画像が作れる「Whisk」Googleの新しい画像生成AIを解説!
- Googleの新AIツール「Whisk」
- 画像を使って簡単に新しい画像を作れる仕組み
- 「Imagen 3」と「Gemini」の組み合わせで高度な画像生成が可能
12月16日(現地時間)米Googleが、画像生成AIツール「Whisk」を発表しました。※1
「Whisk」と呼ばれるこのツールは、従来のテキストベースの画像生成と違い、画像を入力するだけでAIが新たな画像を生み出す機能を備えています。
この記事では、Whiskの特徴や生成された画像について詳しくご紹介します。ぜひ最後までご覧ください!
Whiskとは
Whiskは、Googleが開発した実験的な画像生成AIツールです。これまでのAI画像生成ツールとは違い、テキストプロンプトではなく画像を入力して新しい画像を生成します。
ユーザーは「Subject(被写体)」「Scene(シーン)」「Style(スタイル)」の3つの要素に画像をドラッグ&ドロップするだけで、AIがそれらをリミックスして独自の画像を作り出します。Whiskの名前は「泡立て器」を意味し、3つの要素を混ぜ合わせて新しい創造物を生み出すイメージを表現しているそうです。
現在、アメリカのユーザーを対象に、Google Labsのサイトで試用が可能となっています。
なお、おすすめの画像生成AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
Whiskの特徴
Whiskは、従来のAI画像生成ツールとは全く違った独自の特徴を持っています。その機能は、クリエイターに新たな可能性を提供してくれるものが多くあります。
①画像入力で画像生成
Whiskの最大の魅力は、好きな画像を使って新しいビジュアルを簡単に生成できる点です。
使う人は「Subject(被写体)」「Scene(シーン)」「Style(スタイル)」3つの画像を入れるだけ。AIがそれぞれの画像の特徴を読み取って、全く新しい画像を生成してくれます。
今までのテキストで指示を出す方法と比べると、頭の中のイメージを画像としてそのまま伝えられるため、思い通りの画像に近づけられるでしょう。もちろんテキストで細かい指示を付け加えることも可能です。
この機能のおかげで、言葉では表現しづらい微妙なニュアンスや雰囲気を、AIにうまく伝えやすくなりました。写真やイラストなど、いろんな種類の画像を組み合わせてみると、思いもよらない面白い画像が生まれるかもしれません。
②ドラッグ&ドロップで入力可能
Whiskの使い方はとってもシンプルで、誰でも簡単に扱えます。好きな画像をドラッグ&ドロップで、ポンと置くだけでOK。
このツールの面白いところは、Whiskが提案してくれる画像も使えることです。絵を描くのが得意な人はもちろん、絵が苦手な人でも、簡単に創作できるのがWhiskの良いところです。
③使われているモデルは「Imagen 3」
Whiskの画像生成には、Googleの最新AI画像生成モデル「Imagen 3」が使用されています。このAIは、高品質な画像生成はもちろん、テキストの表示も可能です。
Whiskを使うと、「Gemini」が入力した画像の説明文を作ります。その説明文を「Imagen 3」に渡して、新たに画像を生成してもらうという仕組みです。この2つのAIモデルを組み合わせることにより、Whiskは高度な画像理解と生成能力を実現しています。
「Imagen 3」は細かい描写までしっかり描けるので、できあがる画像はとてもリアルで説得力があります。「Gemini」が画像の内容をよく理解して説明してくれるおかげで、ユーザーの意図に沿った画像が生成できるようになっています。
Whiskで生成された画像
Whiskが生成する画像は、ユーザーの想像力を刺激し、新たなアイデアを引き出します。このツールを使えば、思いもよらない組み合わせや斬新な画像が次々と作り出せるでしょう。
ここでは、Whiskが作り出した画像を4つ紹介します!
蓮の上でくつろぐ猫
紫色の幻想的な猫が大きな蓮の上で横たわっている画像です。
猫の毛並みは、鮮やかな紫色で、その体にはキラキラとした光が散りばめられています。エメラルドグリーンの瞳は神秘的で、周囲の蓮の花や葉との美しい色合いが特徴的です。
大きな蓮の葉は鮮やかな緑色で、葉脈など細部まで丁寧に描かれており、猫の背景には白い蓮の花が深い青緑色の水面にその花を映しています。水面には波紋や光の反射がリアルに表現されており、背景全体にリアルな質感を与えています。
この画像は、蓮と猫というモチーフに宇宙や星空といった非現実的な要素を組み合わせた、魅力的な作品となっています。
ピンク色のトド
海辺の岩場に、ピンク色のトドが座っている画像です。現実にはありえないような画像を、Whiskは見事に描き出しています。
トドの体は全身ピンク色で、いちご柄の服を着ています。ぷくぷくとした体型や、特徴的なヒゲまでしっかり描かれていますね。
この不思議な組み合わせが、絵全体にファンタジーな雰囲気を醸し出しています。Whiskが現実にはない組み合わせを、自然に表現できるのか分かる画像です。
このような画像を広告やイラスト本で使えば、きっと多くの人の目を引くことでしょう。子供から大人まで、みんなの想像力を刺激する、そんな魅力的な一枚です。
魚とお城を組み合わせた画像
まるでおとぎ話から飛び出してきたような、不思議な魚の絵です。青緑色の体には機械仕掛けのような歯車が描かれており、城壁や塔、風車が重なり合って建ち並び、まるで空飛ぶ街のようです。
背景には青い海と白い雲が広がり、この魚が空中を泳いでいる様子がうかがえます。夕暮れを思わせるカラーは、どこか懐かしくて温かい雰囲気が伝わってきます。まるでジブリ映画のワンシーンのような、夢と現実が交差する独創的な世界観です。
このような独創的な絵は、子供向けの絵本や、ファンタジー作品のイメージ画として使えそうですね。見る人の心をくすぐる、想像力豊かな作品に仕上がっています。
ドーナツをイラスト風に変換
普通のドーナツの写真をイラスト風に変換した画像です。まるでポップアートのようなイラストに変わっています。
形はそのままドーナツですが、表面の質感や色使いが大胆に変わっています。イチゴチョコレートのコーティングは、つやつやなピンク色に。カラフルなスプリンクルもフラットな色面になっています。
写真からポップなイラストに変えられるなんて、本当にすごいですね!こういった絵は、お菓子のパッケージやカフェのメニュー表、SNSの投稿画像などに活用できるでしょう。
日常的な物や食べ物をアート作品に変える、Whiskの驚くべき能力を示す素晴らしい例と言えます。
Whiskの今後に注目!
これまでテキストで詳細に説明しなければならなかった画像生成も、Whiskならたった3つの画像を選ぶだけで、新しい画像が生まれます。
現在はアメリカ限定のサービスですが、近い将来、世界中のユーザーが利用できるようになると期待されています。Whiskを使えば、プロのデザイナーはもちろん、絵に自信がない人でも、頭の中にあるアイデアを手軽に形にすることができるでしょう。写真をポップなイラストに変えたり、見たことのない架空の生き物を作ったりと、楽しみ方は無限に広がります。
Whiskは、新しいアイデアを引き出し、創作活動をより楽しくする頼もしいツールです。これからの画像生成のあり方を大きく変える可能性を秘めており、多くの人にとって創作のハードルをぐっと下げてくれる気がします!
- ※1:Whiskについて
最後に
いかがだったでしょうか?
画像生成AIを活用することで、デザイン制作やコンテンツ生成の工数を大幅に削減し、短時間で高品質なビジュアルを作成できます。これにより、企画から実行までの効率化とクリエイティブ業務の最適化が可能です。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。