【Stable Assistant】超高性能な画像生成用AIチャットが便利すぎる!特徴を徹底解説
WEELメディア事業部AIライターの2scです。
みなさん!Stable DiffusionでおなじみのStability AI社が、DALL-E 3も真っ青の画像生成用AIチャット「Stable Assistant」をリリースしています。
こちらはなんと、対話形式で案出し・画像生成・画像編集が可能。例えば、以下の投稿のように……
画像中の鳥をピンポイントでネズミに変えたり、魚の落書きを写真風に仕立て直したりできちゃうんです!
ということで当記事では、Stable Assistantの概要から機能までを徹底解説。完読いただくと、画像生成の次のトレンドが見えてくるかも……です。
ぜひぜひ、最後までお読みください!
Stable Assistantの概要
「Stable Assistant」は、画像生成AI・Stable DiffusionでおなじみのStability AI社が2024年4月17日に発表した生成AIチャットサービス。(※1)2024年5月時点では、ベータ版が公開されています。
このStable Assistantのすごいところは……
● 同社最新の画像生成AI「Stable Diffusion 3」による画像生成・編集機能を提供
● 同社の大規模言語モデル(LLM)「Stable LM 2 12B」によるチャット機能を提供
● 同社の動画生成AI「Stable Video Diffusion」による動画生成機能も実装予定
以上の3点です。ついに社外ブラウザアプリやローカルアプリ(Stable Diffusion web UI)なしで、Stable Diffusionが使えるようになりました!
しかもその使い勝手は……
ChatGPTのDALL-E 3同様、自然言語でのチャット形式で快適!「打倒OpenAI & Midjourney」に向けてのStability AIの本気度がうかがえますね。
なお、Stable Diffusion web UI専用のGPU拡張機能について詳しく知りたい方は、下記の記事を合わせてご確認ください。
Stable Assistantに搭載される生成AI
Stability AI発の生成AIチャット「Stable Assistant」には、同社による最新の生成AIモデルが搭載されています。それは……
- Stable LM 2 12B:大規模言語モデル(LLM)
- Stable Diffusion 3:最新の画像生成AI
- Stable Video Diffusion(今後実装予定):動画生成AI
以上3モデル。まずは、テキストでの受け答えに欠かせないLLMから、詳しくみていきましょう!
Stable LM 2 12B
Stable Assistantでテキストによる受け答えを担うのは、Stability AI製のLLM「Stable LM 2 12B」です。(※2)
このStable LM 2 12Bは、パラメータ数が120億と小型ながら高性能。言語能力・数学力・知識を試す160問のテスト「MT Bench」では……
以上のとおりMetaの「Llama 2 70B」やアリババの「Qwen1.5 14B」といった、より大型のモデルを打ち破っています。
ただ、このStable LM 2 12Bは学習データが、
- 英語
- スペイン語
- ドイツ語
- イタリア語
- フランス語
- ポルトガル語
- オランダ語
のみであるため日本語未対応。われわれとしては、日本語対応モデル「Japanese Stable LM Beta」の実装を待ちたいところです。
Stable Diffusion 3
Stable Assistantは、おなじみの画像生成AI・Stable Diffusionも搭載しています。ただ採用されているのは、従来型とは一味も二味も違う最新モデル「Stable Diffusion 3」です。(※3)
このStable Diffusion 3は、OpenAI・Soraと同じ心臓「拡散トランスフォーマー・アーキテクチャ」を搭載するスマートな画像生成AI。従来のStable Diffusion(1.5 / 2.0 / 2.1 / XL / XL Turbo)比で……
- 画像中文字の描画精度
- 複数主題のプロンプトへの理解力
- 画質
がそれぞれ大幅UPしています。
なかでも特筆すべきは、文字の描画精度でしょう。下記プロンプトをStable Diffusion 3に入力すると……
Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy
色とりどりのエネルギーでできた「Stable Diffusion 3」と書かれた宇宙の呪文を暗い空に唱える、夜の山の上の魔法使いの壮大なアニメ作品。
なんとこのように、綺麗な文字入りの画像が生成できてしまいます。
Stable Video Diffusion(今後実装予定)
Stable Assistantには今後、Stable Diffusionから派生した動画生成AI「Stable Video Diffusion」も実装される予定です。(※4)こちらは入力画像をもとに……
以上のとおり、アニメ系からリアル系まで様々な動画が生成可能。スペックは……
- 一度に生成できる動画の長さ:2〜5秒
- フレームレート:最大30FPS(フレーム/秒)
- 処理にかかる時間:2分以下
というふうになっていて、ストレスなく動画生成ができちゃいます。
Stable Assistantにできること
LLM・画像生成AI・動画生成AIをフル装備したStable Assistantは……
- チャット形式での対話・操作
- 画像生成
- 画像編集
- 動画生成(今後実装予定)
以上4つの機能を備えています。まずはChatGPTやGeminiでおなじみの「チャット形式での対話・操作」から、詳細をみていきましょう!
チャット形式での対話・操作
Stable Assistantは、ChatGPT / Gemini / Claude 3でおなじみの生成AIによるチャット機能を備えています。DALL-E 3よろしく、チャット形式での画像生成もできて……
ユーザー:こんにちは、スペーステーマのレストランメニューのために革新的なアイデアを探しています。何かクリエイティブな料理名のアイデアはありますか?
Stable Assistant:もちろん、スペーステーマのレストランメニューのためのクリエイティブな料理名をいくつか紹介します:
- ネビュラヌードル:コズミックな雲を連想させるツイストヌードルに風味豊かなソースをかけて……
ユーザー:わあ、ネビュラヌードルを見せてくれますか?
Stable Assistant:こちらがネビュラヌードルの芸術的な表現です(下に生成した画像)
以上のとおり、構図を考えるところから絵に仕上げるところまで生成AIに丸投げできちゃいます。
画像生成
Stable Assistantは、Stable Diffusion 3による画像生成機能を備えています。こちらは先述のとおり、文字を保ったまま美麗画像が生成可能。下記のプロンプトを入力するだけで……
cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk
教室のテーブルの上に置かれた赤いリンゴの映画のような写真、黒板にはチョークで「go big or go home」と書かれている
このように、写真と見間違えるほどに高品質な画像が生成できちゃいます!
画像編集
Stable Assistantなら、生成した画像の編集も自由自在。具体的には、プロンプトひとつで……
- Search and Replace:物体の検索と置換
- Remove Background:背景の削除
- Creative Upscale:拡大と画風の変換
- Control Structure:構図のみ残して画風変換
- Outpaint:外枠の模様替え
- Sketch:落書きを整った画像に変換
といったことができてしまいます。
以下、Stable Assistantの画像編集機能の例もみていきましょう。まず「Control Structure」では……
このようにトラクターと背景の配置を保ちながら、画像の雰囲気のみが変更可。そして「Sketch」なら……
以上のとおり、魚の落書きがフォトリアルな画像に変換できてしまいます。Midjourneyの「image to image」とは、比べ物にならないほどの高精度ですね。
動画生成(今後実装予定)
時期は未定ですが、Stable AssistantにはStable Video Diffusionによる動画生成機能も実装予定。これが実現した暁には、SoraやAdobe Premiere Proに匹敵する動画用AIツールが誕生するかも……です。
なお、Adobe Premiere Proの動画生成機能について詳しく知りたい方は、下記の記事を合わせてご確認ください。
Stable Assistantの料金体系
Stable Assistantは有料のAIツールです。下表のとおり4種の料金プランが用意されていて、それぞれ画像生成やチャットに必要な「クレジット」の配布量が異なります。
STANDARD | PRO | PLUS | PREMIUM | |
---|---|---|---|---|
内容 | ・月900クレジット付与 ・チャット履歴保存 | ・月1900クレジット付与 ・チャット履歴保存 | ・月5500クレジット付与 ・チャット履歴保存 | ・月12000クレジット付与 ・チャット履歴保存 |
料金(月払い) | 月額9ドル | 月額19ドル | 月額49ドル | 月額99ドル |
料金(年払い) | 年額90ドル | 年額190ドル | 年額490ドル | 年額990ドル |
ちなみにクレジットの消費量は……
- チャットでの対話:1回で0.1クレジットを消費
- 画像生成:1回で6.5クレジットを消費
以上のとおり。登録後3日間は無料トライアルが可能 & プラン変更はいつでもOKですので、自分に合ったプランをじっくりと選んでみましょう。
なお、ローカル環境でStable Diffusionを使いたい方は、下記の記事を合わせてご確認ください。
「Stable Assistant」なら気軽に画像生成できる
当記事では、Stability AIが送る画像生成AI & LLM搭載のAIチャット「Stable Assistant」について解説しました。Stable Assistantのすごいところについて、以下にてもう一度振り返ってみましょう!
● 同社最新の画像生成AI「Stable Diffusion 3」による画像生成・編集機能を提供
● 同社の大規模言語モデル(LLM)「Stable LM 2 12B」によるチャット機能を提供
● 同社の動画生成AI「Stable Video Diffusion」による動画生成機能も実装予定
このStable Assistantなら、構図の案出しから画像生成までが自動化できます。さらにプロンプトを介して、画像の一部改変も自由自在。これまでの画像生成AI搭載ツールとは比べ物にならない性能を誇っています。
そんなStable Assistantは、登録から3日間の無料トライアルが可能。気になった方はぜひ、登録してみてくださいね!
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
WEELの生成AIへのスタンス
ChatGPTやStable Diffusionなど使い勝手の良いAIサービスは沢山あります。そういったもの1度使ってみて、もっとこうしたい、こう言った使い方をしたいと言った方に向けてカスタマイズを勧めております。
もし、自社で生成AIを活用したいという場合は
1. 汎用的な生成AIツールを導入し、定着させる
2. 業務を生成AIに解けるタスクまで分解し、自動化する
のどちらかが良いと思います。
弊社では
1の場合、生成AIセミナーの実施や生成AIコンサルティングなどで、AI専門家による生成AI活用指導
2の場合、PoC開発やソリューション開発などで、LLMエンジニアやAIコンサルタントが御社にあったAIツールの開発を行います。
無料相談にてご相談を承っておりますので、興味がある方は以下からご連絡ください。
→無料相談で話してみる
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。