生成AIとLLMの連携で画像生成が進化
生成AI画像と大規模言語モデル(LLM)の連携について、PC Watchの西川和久氏が解説しています。
- 生成AIとLLMの統合で使いやすさ向上
- VRAM容量不足がローカルPCでの試行を困難に
- 英語プロンプトで詳細設定が可能に
以前は、別々のシステムでLLMを使用し、生成された英文をプロンプトにコピペしていましたが、生成AIとLLMが統合されることで、使いやすさが向上しました。
しかし、ビデオカードのVRAM容量が問題となり、24GBでもギリギリの状況です。
ローカルPCでの試行は難易度が高く、円安も影響しています。1年前の2023年6月、画像生成AI「Stable Diffusion」はバージョン1.5で、LLM「GPT-4」などは独立して動作していました。
しかし、最近のSDXLやSD3 Mediumなどのモデルでは、LLMと生成AIの関係が密接になり、プロンプトの記述方法も進化しました。
特に、詳細なプロンプトを書く際には、LLMを利用してより具体的な指示を出すことが求められます。
生成AI画像の位置関係やサイズ指定も細かく設定できるようになり、英語でのプロンプト入力が重要です。
ローカルPCでの生成を可能にするためにソースコードを改良し、Upscaleされた英文を固定する機能を追加。
これにより、LLMを毎回動かす必要がなくなり、効率が向上しました。
参考記事:PC Watch
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。