生成AIとLLMの連携で画像生成が進化

生成AI LLM 画像生成

生成AI画像と大規模言語モデル(LLM)の連携について、PC Watchの西川和久氏が解説しています。

このNEWSをAIが簡単要約
  • 生成AIとLLMの統合で使いやすさ向上
  • VRAM容量不足がローカルPCでの試行を困難に
  • 英語プロンプトで詳細設定が可能に

以前は、別々のシステムでLLMを使用し、生成された英文をプロンプトにコピペしていましたが、生成AIとLLMが統合されることで、使いやすさが向上しました。

しかし、ビデオカードのVRAM容量が問題となり、24GBでもギリギリの状況です。

ローカルPCでの試行は難易度が高く、円安も影響しています。1年前の2023年6月、画像生成AI「Stable Diffusion」はバージョン1.5で、LLM「GPT-4」などは独立して動作していました。

しかし、最近のSDXLやSD3 Mediumなどのモデルでは、LLMと生成AIの関係が密接になり、プロンプトの記述方法も進化しました。

特に、詳細なプロンプトを書く際には、LLMを利用してより具体的な指示を出すことが求められます。

生成AI画像の位置関係やサイズ指定も細かく設定できるようになり、英語でのプロンプト入力が重要です。

ローカルPCでの生成を可能にするためにソースコードを改良し、Upscaleされた英文を固定する機能を追加。

これにより、LLMを毎回動かす必要がなくなり、効率が向上しました。

参考記事:PC Watch

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次