Uni-1とは?Luma AIが発表した理解と生成を統合した次世代画像生成モデルを徹底解説

- Uni-1は理解と生成を1つのモデルに統合した次世代マルチモーダル推論モデル
- 自己回帰型Transformerにより、指示の意図を理解しながら画像を生成
- Human Preference EloでOverall・スタイル編集・参照ベース生成の3カテゴリで1位を獲得
2026年3月、画像生成AIの分野において、新たなモデルが登場しました。
今回発表された「Uni-1」は、画像生成と理解、さらには推論までを単一モデルに統合した次世代のマルチモーダルAIです。従来の画像生成モデルが「指示に基づいて画像を作る」ことに特化していたのに対し、Uni-1は指示の意図や文脈を理解し、構造的に思考したうえで画像を生成する点が特徴です。
一方で、新たな画像生成モデルが登場するたびに、「従来モデルと何が違うのか」「どこまで理解しているのか」「実務レベルでどのように活用できるのか」といった疑問を持つ方も多いのではないでしょうか。
そこで本記事では、Uni-1の概要や仕組み、技術的な特徴を整理しながら、従来モデルとの違いや具体的な活用について解説します。
最後までお読みいただくことで、Uni-1が目指す「Unified Intelligence(統合知能)」とは何か、その本質が理解できるはずです。
\生成AIを活用して業務プロセスを自動化/
Uni-1とは
Uni-1は、米国のAI企業Luma AIが2026年3月に発表したマルチモーダル推論モデルです。
「画像を生成できる推論モデル」と位置づけられており、単なる画像生成ツールではなく、指示内容の理解・推論と画像生成を一体で処理できます。

Luma AIはこれまで、テキストから動画を生成する「Dream Machine」や、テキストから画像を生成する「Photon」などを開発してきました。
Uni-1を「Unified Intelligence(統合知能)」への第一歩と位置づけられており、従来の画像生成モデルが「見栄えのよい画像を生成すること」に特化していたのに対し、Uni-1は指示に含まれる文脈・因果関係・空間配置・時間的前後関係を踏まえながら画像を組み立てる設計となっています。
従来の画像生成AIとUni-1の違い
これまでの画像生成AIは、テキストのプロンプトを受け取って画像を出力する「生成専用」の構造が主流でした。
理解・推論と生成は、それぞれ別のモデルが担うのが一般的。しかし、Uni-1はこの構造を根本から変え、1つのモデルの中で両方を処理します。
| 比較項目 | 従来の画像生成AI | Uni-1 |
|---|---|---|
| 理解・推論 | 別モデルが担当(または非対応) | 同一モデル内で処理 |
| 文脈の把握 | プロンプトの文字列を解釈 | 因果・空間・時間・論理を統合的に理解 |
| 参照画像の活用 | 1〜2枚程度が一般的 | 最大9枚の参照画像を使用可能 |
| 文化的理解 | 限定的 | ミーム・マンガ・多様な美的表現に対応 |
| モデル構造 | 拡散モデル(Diffusion)が主流 | 自己回帰型Transformer |
なお、日本語テキストも崩れない次世代画像生成AIについて、詳しく知りたい方は以下の記事も参考にしてみてください。

Uni-1の仕組み
Uni-1の核となる技術は、自己回帰型Transformer(Autoregressive Transformer)の採用です。
自己回帰型とは、文脈を踏まえながら順番に出力を組み立てていく方式で、テキスト生成AIで広く使われているアーキテクチャ。Uni-1はこの仕組みを画像生成にも適用し、テキストと画像を単一の系列として処理します。
テキストと画像を同じ系列として扱う
従来の画像生成モデルは、テキストエンコーダーで言語を処理し、その結果を画像生成モジュールに渡す「2段階構造」でした。
一方でUni-1では、テキストトークンと画像トークンを同一の系列上で扱います。これにより、言語理解と視覚生成が密接に連携した処理がされています。
処理の流れは以下のとおりです。
- テキストプロンプトおよび参照画像(最大9枚)を入力する
- 自己回帰型Transformerが、入力内容の因果関係・空間配置・時間的前後関係・論理整合性を解析する
- 理解・推論の結果をもとに、画像トークンを順番に生成する
- 生成されたトークン列をデコードして、最終的な画像として出力する
生成能力が理解能力も高める
Uni-1の特徴的な点として、Luma AIは「画像を生成するための学習が、視覚理解そのものの向上にも寄与する」という考えを示しています。
物体検出ベンチマーク「ODinW Dense Detection」の結果が示されており、理解専用モデルのスコアが43.9だったのに対し、Uni-1フルモデルは46.2を記録しています。

Uni-1の特徴
Uni-1には、単なる画像生成の精度向上にとどまらないいくつかの特徴があります。
Luma AIは公式サイトで、「Intelligent(インテリジェント)」「Directable(ディレクタブル)」「Cultured(カルチャード)」という3つのキーワードで特徴を整理しています。
場面を推論して構成するIntelligent
Uni-1は、プロンプトに書かれた内容をそのまま視覚化するのではなく、常識的な場面補完・空間推論・妥当性に基づいた変換を行います。
複数の登場人物や役割が混在する複雑な指示でも、それぞれの関係性を踏まえた構図で画像を生成できる点が特徴です。
RISEBenchと呼ばれる推論性能ベンチマークでは、因果理解・空間理解・時間理解・論理推論の4カテゴリで評価が行われ、Uni-1は総合スコア0.51を記録し、Nano Banana 2やGPT Image 1.5を上回る結果となっています。

参照画像をもとに精密にコントロールするDirectable
Uni-1では、最大9枚の参照画像を入力として使用できるマルチリファレンス生成に対応しています。入力した参照画像の人物・スタイル・構図・雰囲気を忠実に反映しながら、新しい画像を生成することが可能。
画像編集(image-to-image)にも対応しており、既存の画像に対して修正指示を与えることで編集が行えます。キャラクターの参照画像として顔のポートレートと全身像を組み合わせるなど、複数の視点からの参照にも対応しています。
文化的文脈を理解した視覚表現のCultured
Uni-1は、特定の文化的表現スタイルに対する理解力も特徴の一つです。マンガ・ミーム・さまざまな美的スタイルにまたがる視覚表現に対応しており、文化的文脈を踏まえた画像生成が可能となっています。
単に「マンガ風」というスタイル指定だけでなく、特定のキャラクターのポートレートと全身像を参照として与えることで、そのキャラクターのスタイルを維持しながら新たなシーンを描き出す使い方も実現されています。
なお、1秒未満で画像生成できる高速AIモデルであるFLUX.2 [klein]について、詳しく知りたい方は以下の記事も参考にしてみてください。

Uni-1の安全性・制約
Uni-1は高性能な生成モデルですが、その安全性は「モデル単体の制御」ではなく、サービス全体としての利用制約と責任分離によって設計されています。
禁止用途
まずはUni-1の禁止用途です。
Uni-1を含むLumaの生成AIは、以下の用途が明確に禁止されています。
- ポルノ・性的コンテンツの生成
- ディープフェイクや誤認誘導コンテンツ
- 政治操作・選挙への影響行為
- 詐欺・スパム・なりすまし
- 暴力・差別・有害コンテンツの生成
- 違法行為や規制対象活動への利用
入力データとプライバシー
Uni-1では、ユーザーが入力したデータ(テキスト・画像など)は以下の用途で使用される可能性があります。
- モデルの改善・学習
- 新機能開発-解析・統計データ生成
特に重要なのは以下です、
- 入力データは完全な非公開前提ではない
- 無料利用時はより広いライセンスが付与される
- 入力の権利(著作権など)はユーザー側が責任を持つ
つまり、機密情報や医療データなどを扱う場合は注意が必要です。
Uni-1の料金
Uni-1の料金は個人向けプラン・ビジネス向けプラン・APIトークン単位での課金が用意されています。
2026年3月時点ではAPIの一般提供は「近日公開予定」とされており、利用を希望する場合はウェイトリストへの登録が必要です。なお、「Try Uni-1 for Free」として無料での試用も提供されています。

個人向けプラン
まずはUni-1の個人向けプランの料金です。
| プラン | 料金 | 主な特徴 |
|---|---|---|
| Plus | $30/月 | Lumaおよびサードパーティの画像・動画モデル利用、ゲスト共同編集機能、商用利用可 |
| Pro | $90/月 | Plusの全機能、Luma Agentsの利用量が4倍 |
| Ultra | $300/月 | Proの全機能、Luma Agentsの利用量が15倍 |
ビジネス向けプラン
ビジネス向けプランのTeamsはまだ公開されていませんが、近日公開予定になっています。また、エンタープライズに関しては問い合わせの必要があります。
| プラン | 提供状況 | 主な特徴 |
|---|---|---|
| Team | Coming soon | チームメンバー管理、プロジェクト共有、組織管理、利用状況分析、ユーザーごとの利用制限、SSO対応 |
| Enterprise | 要問い合わせ | Teamの全機能、エンタープライズ契約対応、専用トレーニング、教育支援、カスタムファインチューニング |
APIトークン単価
APIトークン単価は下記のとおりです。2026年3月時点ではまだAPIを使うことができませんが、希望者はウェイトリストに登録して、公開を待つ必要があります。
| 種別 | 単価(1Mトークンあたり・USD) |
|---|---|
| 入力(テキスト) | $0.50 |
| 入力(画像) | $1.20 |
| 出力(テキスト・思考) | $3.00 |
| 出力(画像) | $45.45 |
なお、リアルタイム画像編集であるKrea AIのRealtime Editについて、詳しく知りたい方は以下の記事も参考にしてみてください。

Uni-1のライセンス
Uni-1はオープンソースではなく、SaaS型のサービスです。そのため、一般的なOSS(MITやApache)のように「自由に改変・再配布できるモデル」ではありません。
Uni-1で可能・不可能なことを整理したのが下記表です。
| 項目 | 可否 |
|---|---|
| 私的利用 | ⭕️ |
| 商用利用 | 🔺(有料プランのみ) |
| 配布(モデル) | ❌ |
| 配布(Output) | 🔺 |
| 改変 | ❌ |
| 特許利用 | 🔺 |
\画像生成AIを商用利用する際はライセンスを確認しましょう/
Uni-1の使い方
Uni-1はLuma AIの製品ラインナップの中に組み込まれており、Luma AIのサービスにアクセスすることで利用できます。
「Try Uni-1 for Free」として無料での試用が提供されており、まずはアカウントを作成して体験することが可能です。

新規登録もしくはログインを求められるので、初めて使用する場合には新規登録をしましょう。

下記の画面になれば画像生成を使用できます。

あとはテキスト欄にプロンプトを入力すればOKです。
実際に生成している様子がこちら。
【業界別】Uni-1の活用シーン
Uni-1は「理解・推論・生成の統合」という特性から、さまざまな業界での活用が期待されます。ここでは、業界ごとの活用シーンを紹介します。
クリエイティブ・エンターテインメント
マンガ・イラスト・ゲームなどのクリエイティブ分野は、Uni-1の「Cultured」能力が最も活かされる領域です。キャラクターのポートレートと全身像を参照として与えることで、そのキャラクターのスタイルを維持しながら新たなシーンを生成できます。
複数の参照画像から世界観を指定できるため、ブランドやIPの一貫性を保ちながら大量の画像を制作することが可能です。
生成AIでクリエイティブ作成する方法は下記で解説

マーケティング・広告
マーケティング・広告の分野では、ブランドのビジュアルガイドラインに沿った画像の大量生成が課題となっています。Uni-1のDirectable機能を使えば、ブランドカラーやスタイルが含まれた参照画像をもとに、さまざまなバリエーションを効率よく生成できます。
SNS向けクリエイティブの制作や、キャンペーンバナーの素材生成など、反復的な制作業務の自動化にも応用が考えられます。
生成AIでCVRが爆上がりのマーケティング活用方法について、詳しく知りたい方は以下の記事も参考にしてみてください。

AIで広告運用を最適化する方法について、詳しく知りたい方は以下の記事も参考にしてみてください。

出版・コンテンツ制作
書籍の挿絵・雑誌ビジュアル・ウェブメディアのサムネイルなど、出版・コンテンツ制作の現場でも活用が期待されます。Uni-1の推論能力は、テキスト内容を理解した上で適切な場面を視覚化する点で有用です。
記事の内容に合った画像を自動生成したり、既存のビジュアルスタイルを参照しながら統一感のある画像を量産したりといった用途が考えられます。
AIを活用して出版の競争力を強化する方法について、詳しく知りたい方は以下の記事も参考にしてみてください。

教育・研修
教育分野では、説明資料やe-learningコンテンツ用のビジュアル制作に活用が期待されます。複雑な概念を視覚的に表現する場面で、文脈を理解して画像を生成するUni-1の能力が活きる場面でもあります。
生成AIを活用した業務効率化について詳しく知りたい方は、以下の記事も参考にしてみてください。
生成AI×教育は下記で解説

Uni-1を実際に使ってみた
トップページのテキスト欄から画像を生成することもできますが、明確にUni-1を指定することもできます。

赤枠をクリックすることで、編集ページに遷移します。編集ページで下部にあるGenerate Imageをクリックし、Uni-1を選択すればOKです。

実際に作られた画像がこちらです。プロンプトは下記です。
A young man sitting at a café, drinking coffee and looking out the window,soft natural lighting, calm atmosphere, realistic style日本語訳
カフェに座ってコーヒーを飲みながら窓の外を眺めている若い男性。柔らかな自然光、落ち着いた雰囲気、写実的なスタイル

Referencesには画像がなくても問題ありません。Instructionに画像の説明を記入し、Createをクリックすれば画像が作られます。

また、Image to Imageを行う場合には、Referencesに画像を入力し、どのような画像に編集したいかをInstructionに入力すればOKです。
実際に一連の生成を行っている様子が下記です。
編集した画像がこちら。プロンプトは下記です。
Edit the image and keep the same subject and layout.
Modify:
Transform the style into a cinematic film look
Add shallow depth of field and soft background blur
Apply warm color grading
Do not change the person or the scene structure.日本語訳
画像を編集し、被写体と構図はそのままにしておいてください。
変更点:
映画のような映像的な雰囲気に仕上げる
浅い被写界深度と背景の柔らかなボケを加える
暖色系のカラーグレーディングを適用する
人物やシーンの構成は変更しないでください。

【課題別】Uni-1が解決できること
ここでは既存の画像生成AIが抱える課題と、Uni-1がどのようなアプローチで対応しているかを解説します。
複数の登場人物・役割が含まれる複雑な指示を正確に反映できる
従来の画像生成AIでは、「AとBが会議室でプレゼンをしており、CとDが聴衆として見ている」といった複数主体が絡む指示は、構図や役割関係が崩れることが多くありました。
Uni-1は推論能力によってこうした関係性を整合的に把握し、場面をより自然に表現します。
上記を生成すると下記のようになります。

ちなみに日本語のプロンプトだと以下のように若干ズレます。

キャラクターの一貫性を保ちながら大量生成できる
同一キャラクターの外見を維持しながら複数のシーンを生成することは、既存モデルにとって難易度が高い課題です。
Uni-1では最大9枚の参照画像を入力できるため、ポートレート・全身・表情などを組み合わせてキャラクターの一貫性を保った生成が可能です。
文化的文脈のある表現スタイルにも対応できる
マンガ・ミーム・特定の美的スタイルといった文化的文脈を含む表現は、汎用的な画像生成AIでは再現精度に限界がありました。
Uni-1はこうした文化的表現への理解を持った設計になっており、スタイルの再現性が高い点が挙げられます。
Z.ai発のオープンソースかつ商用利用OKの画像生成モデルであるGLM-Imageについて、詳しく知りたい方は以下の記事も参考にしてみてください。

Uni-1の活用事例
ここではXでUni-1を実際に使用されている投稿を紹介し、どのような活用事例があるかを考えていきます。
まずはこちらの投稿です。STYLEにmangaがあることから、漫画の生成力が高いことがわかりますね。

下記の投稿は画像を生成するのみならず、映像にされています。Uni-1の特徴を押さえた使い方ですね。
Uni-1のよくある質問
Uni-1でクリエイティブが変わる!
この記事では、Luma AIが発表した次世代マルチモーダル推論モデル「Uni-1」について解説しました。
Uni-1は、「生成するだけのAI」から「考えながら生成するAI」への転換を体現したモデルです。
クリエイティブ制作・マーケティング・コンテンツ産業など、複雑なビジュアル表現が求められる現場での活用が期待されます。APIの一般提供が始まれば、業務への組み込みの幅がさらに広がるでしょう。
最後に
いかがだったでしょうか?
Uni-1を活用することで、複雑な指示への対応や参照ベースの画像生成など、これまで難しかったクリエイティブ制作の課題を解決できる可能性があります。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。
