MENU

生成AIとLLMの連携で画像生成が進化

2024-06-20

生成AI LLM 画像生成

生成AI画像と大規模言語モデル（LLM）の連携について、PC Watchの西川和久氏が解説しています。

このNEWSをAIが簡単要約

生成AIとLLMの統合で使いやすさ向上
VRAM容量不足がローカルPCでの試行を困難に
英語プロンプトで詳細設定が可能に

以前は、別々のシステムでLLMを使用し、生成された英文をプロンプトにコピペしていましたが、生成AIとLLMが統合されることで、使いやすさが向上しました。

しかし、ビデオカードのVRAM容量が問題となり、24GBでもギリギリの状況です。

ローカルPCでの試行は難易度が高く、円安も影響しています。1年前の2023年6月、画像生成AI「Stable Diffusion」はバージョン1.5で、LLM「GPT-4」などは独立して動作していました。

しかし、最近のSDXLやSD3 Mediumなどのモデルでは、LLMと生成AIの関係が密接になり、プロンプトの記述方法も進化しました。

特に、詳細なプロンプトを書く際には、LLMを利用してより具体的な指示を出すことが求められます。

生成AI画像の位置関係やサイズ指定も細かく設定できるようになり、英語でのプロンプト入力が重要です。

ローカルPCでの生成を可能にするためにソースコードを改良し、Upscaleされた英文を固定する機能を追加。

これにより、LLMを毎回動かす必要がなくなり、効率が向上しました。

参考記事：PC Watch

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

メルマガに登録する

資料をダウンロードする

URLをコピーしました！

URLをコピーしました！

「日本一透明性の高いAIプロフェッショナル集団」
を目指して

私たちは、AIに関わるすべての人に向けて、透明性の高い適切な情報発信と開発を行います。
「WEELは、一番地に足ついたAI情報を教えてくれる」
と思っていただけるよう、透明性高い事業運営を行なって参ります。

私たちは、AIに関わるすべての人に向けて、
透明性の高い適切な情報発信と開発を行います。
「WEELは、
一番地に足ついたAI情報を教えてくれる」
と思っていただけるよう、
透明性高い事業運営を行なって参ります。

無料で相談してみる

会社紹介資料ダウンロード

通勤時間で読める

生成AIメールマガジンを読む