【Stable Assistant】超高性能な画像生成用AIチャットが便利すぎる!特徴を徹底解説

Stable-Assistant 超高性能 画像生成用AIチャット 特徴 徹底解説

WEELメディア事業部AIライターの2scです。

みなさん!Stable DiffusionでおなじみのStability AI社が、DALL-E 3も真っ青の画像生成用AIチャット「Stable Assistant」をリリースしています。

こちらはなんと、対話形式で案出し・画像生成・画像編集が可能。例えば、以下の投稿のように……

画像中の鳥をピンポイントでネズミに変えたり、魚の落書きを写真風に仕立て直したりできちゃうんです!

ということで当記事では、Stable Assistantの概要から機能までを徹底解説。完読いただくと、画像生成の次のトレンドが見えてくるかも……です。

ぜひぜひ、最後までお読みください!

目次

Stable Assistantの概要

「Stable Assistant」は、画像生成AI・Stable DiffusionでおなじみのStability AI社が2024年4月17日に発表した生成AIチャットサービス。(※1)2024年5月時点では、ベータ版が公開されています。

このStable Assistantのすごいところは……

● 同社最新の画像生成AI「Stable Diffusion 3」による画像生成・編集機能を提供
● 同社の大規模言語モデル(LLM)「Stable LM 2 12B」によるチャット機能を提供
● 同社の動画生成AI「Stable Video Diffusion」による動画生成機能も実装予定

以上の3点です。ついに社外ブラウザアプリやローカルアプリ(Stable Diffusion web UIなしで、Stable Diffusionが使えるようになりました!

しかもその使い勝手は……

参考:https://images.squarespace-cdn.com/content/v1/6213c340453c3f502425776e/295e25fc-ec9d-4439-9769-5fba77cd2eb5/stable_assistant_chat_2.jpg

ChatGPTのDALL-E 3同様、自然言語でのチャット形式で快適!「打倒OpenAI & Midjourney」に向けてのStability AIの本気度がうかがえますね。

なお、Stable Diffusion web UI専用のGPU拡張機能について詳しく知りたい方は、下記の記事を合わせてご確認ください。

Stable Assistantに搭載される生成AI

Stability AI発の生成AIチャット「Stable Assistant」には、同社による最新の生成AIモデルが搭載されています。それは……

以上3モデル。まずは、テキストでの受け答えに欠かせないLLMから、詳しくみていきましょう!

Stable LM 2 12B

Stable Assistantでテキストによる受け答えを担うのは、Stability AI製のLLM「Stable LM 2 12B」です。(※2)

このStable LM 2 12Bは、パラメータ数が120億と小型ながら高性能。言語能力・数学力・知識を試す160問のテスト「MT Bench」では……

参考:https://stability.ai/news/introducing-stable-lm-2-12b

以上のとおりMetaの「Llama 2 70B」やアリババの「Qwen1.5 14B」といった、より大型のモデルを打ち破っています。

ただ、このStable LM 2 12Bは学習データが、

  • 英語
  • スペイン語
  • ドイツ語
  • イタリア語
  • フランス語
  • ポルトガル語
  • オランダ語

のみであるため日本語未対応。われわれとしては、日本語対応モデル「Japanese Stable LM Beta」の実装を待ちたいところです。

Stable Diffusion 3

Stable Assistantは、おなじみの画像生成AI・Stable Diffusionも搭載しています。ただ採用されているのは、従来型とは一味も二味も違う最新モデル「Stable Diffusion 3」です。(※3)

このStable Diffusion 3は、OpenAI・Soraと同じ心臓「拡散トランスフォーマー・アーキテクチャ」を搭載するスマートな画像生成AI。従来のStable Diffusion(1.5 / 2.0 / 2.1 / XL / XL Turbo)比で……

  • 画像中文字の描画精度
  • 複数主題のプロンプトへの理解力
  • 画質

がそれぞれ大幅UPしています。

なかでも特筆すべきは、文字の描画精度でしょう。下記プロンプトをStable Diffusion 3に入力すると……

Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy
プロンプト和訳

色とりどりのエネルギーでできた「Stable Diffusion 3」と書かれた宇宙の呪文を暗い空に唱える、夜の山の上の魔法使いの壮大なアニメ作品。

参考:https://ja.stability.ai/blog/stable-diffusion-3

なんとこのように、綺麗な文字入りの画像が生成できてしまいます。

Stable Video Diffusion(今後実装予定)

Stable Assistantには今後、Stable Diffusionから派生した動画生成AI「Stable Video Diffusion」も実装される予定です。(※4)こちらは入力画像をもとに……

以上のとおり、アニメ系からリアル系まで様々な動画が生成可能。スペックは……

  • 一度に生成できる動画の長さ:2〜5秒
  • フレームレート:最大30FPS(フレーム/秒)
  • 処理にかかる時間:2分以下

というふうになっていて、ストレスなく動画生成ができちゃいます。

Stable Assistantにできること

LLM・画像生成AI・動画生成AIをフル装備したStable Assistantは……

  • チャット形式での対話・操作
  • 画像生成
  • 画像編集
  • 動画生成(今後実装予定)

以上4つの機能を備えています。まずはChatGPTやGeminiでおなじみの「チャット形式での対話・操作」から、詳細をみていきましょう!

チャット形式での対話・操作

Stable Assistantは、ChatGPT / Gemini / Claude 3でおなじみの生成AIによるチャット機能を備えています。DALL-E 3よろしく、チャット形式での画像生成もできて……

参考:https://images.squarespace-cdn.com/content/v1/6213c340453c3f502425776e/295e25fc-ec9d-4439-9769-5fba77cd2eb5/stable_assistant_chat_2.jpg
チャット内容和訳

ユーザー:こんにちは、スペーステーマのレストランメニューのために革新的なアイデアを探しています。何かクリエイティブな料理名のアイデアはありますか?

Stable Assistant:もちろん、スペーステーマのレストランメニューのためのクリエイティブな料理名をいくつか紹介します:

  1. ネビュラヌードル:コズミックな雲を連想させるツイストヌードルに風味豊かなソースをかけて……

ユーザー:わあ、ネビュラヌードルを見せてくれますか?

Stable Assistant:こちらがネビュラヌードルの芸術的な表現です(下に生成した画像)

以上のとおり、構図を考えるところから絵に仕上げるところまで生成AIに丸投げできちゃいます。

画像生成

Stable Assistantは、Stable Diffusion 3による画像生成機能を備えています。こちらは先述のとおり、文字を保ったまま美麗画像が生成可能。下記のプロンプトを入力するだけで……

cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk
プロンプト和訳

教室のテーブルの上に置かれた赤いリンゴの映画のような写真、黒板にはチョークで「go big or go home」と書かれている

参考:https://ja.stability.ai/blog/stable-diffusion-3

このように、写真と見間違えるほどに高品質な画像が生成できちゃいます!

画像編集

Stable Assistantなら、生成した画像の編集も自由自在。具体的には、プロンプトひとつで……

Stable Assistantの画像編集機能
  • Search and Replace:物体の検索と置換
  • Remove Background:背景の削除
  • Creative Upscale:拡大と画風の変換
  • Control Structure:構図のみ残して画風変換
  • Outpaint:外枠の模様替え
  • Sketch:落書きを整った画像に変換

といったことができてしまいます。

以下、Stable Assistantの画像編集機能の例もみていきましょう。まず「Control Structure」では……

このようにトラクターと背景の配置を保ちながら、画像の雰囲気のみが変更可。そして「Sketch」なら……

参考:https://stability.ai/stable-assistant

以上のとおり、魚の落書きがフォトリアルな画像に変換できてしまいます。Midjourneyの「image to image」とは、比べ物にならないほどの高精度ですね。

動画生成(今後実装予定)

時期は未定ですが、Stable AssistantにはStable Video Diffusionによる動画生成機能も実装予定。これが実現した暁には、SoraやAdobe Premiere Proに匹敵する動画用AIツールが誕生するかも……です。

なお、Adobe Premiere Proの動画生成機能について詳しく知りたい方は、下記の記事を合わせてご確認ください。

Stable Assistantの料金体系

Stable Assistantは有料のAIツールです。下表のとおり4種の料金プランが用意されていて、それぞれ画像生成やチャットに必要な「クレジット」の配布量が異なります。

STANDARDPROPLUSPREMIUM
内容・月900クレジット付与
・チャット履歴保存
・月1900クレジット付与
・チャット履歴保存
・月5500クレジット付与
・チャット履歴保存
・月12000クレジット付与
・チャット履歴保存
料金(月払い)月額9ドル月額19ドル月額49ドル月額99ドル
料金(年払い)年額90ドル年額190ドル年額490ドル年額990ドル

ちなみにクレジットの消費量は……

  • チャットでの対話:1回で0.1クレジットを消費
  • 画像生成:1回で6.5クレジットを消費

以上のとおり。登録後3日間は無料トライアルが可能 & プラン変更はいつでもOKですので、自分に合ったプランをじっくりと選んでみましょう。

なお、ローカル環境でStable Diffusionを使いたい方は、下記の記事を合わせてご確認ください。

「Stable Assistant」なら気軽に画像生成できる

当記事では、Stability AIが送る画像生成AI & LLM搭載のAIチャット「Stable Assistant」について解説しました。Stable Assistantのすごいところについて、以下にてもう一度振り返ってみましょう!

● 同社最新の画像生成AI「Stable Diffusion 3」による画像生成・編集機能を提供
● 同社の大規模言語モデル(LLM)「Stable LM 2 12B」によるチャット機能を提供
● 同社の動画生成AI「Stable Video Diffusion」による動画生成機能も実装予定

このStable Assistantなら、構図の案出しから画像生成までが自動化できます。さらにプロンプトを介して、画像の一部改変も自由自在。これまでの画像生成AI搭載ツールとは比べ物にならない性能を誇っています。

そんなStable Assistantは、登録から3日間の無料トライアルが可能。気になった方はぜひ、登録してみてくださいね!

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

WEELの生成AIへのスタンス

我々はむやみやたらにAIツールの使用をお勧めしていません。

AIツールでできることはほとんどがChatGPTやStable Diffusionなどの大元のAIサービスで行えるからです。
※国内のAIツールの多くはChatGPTだけでも完結できるソリューションを展開しています。

もし、自社で生成AIを活用したいという場合は
1. ChatGPTをフルで使えるようになる
2. 業務を生成AIに解けるタスクまで分解し、自動化する
のどちらかが良いと思います。

弊社では
1の場合、生成AIセミナーの実施や生成AIコンサルティングなどで、AI専門家による生成AI活用指導
2の場合、PoC開発やソリューション開発などで、LLMエンジニアやAIコンサルタントが御社にあったAIツールの開発を行います。

無料相談にてご相談を承っておりますので、興味がある方は以下からご連絡ください。
無料相談で話してみる

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • 2sc

    テクニカルライター 大学時代はアリの生態を研究。 ラボで唯一、Pythonを使ってデータ分析を効率化していた。 現在はライターとして、オウンドメディアや学術記事の執筆に当たっている。

  • URLをコピーしました!
  • URLをコピーしました!
目次