動画制作は、もう“重労働”じゃない!テキストだけで物語を生む「Alibaba Wan 2.6」を徹底解説

動画制作 重労働 テキスト 物語 生む Alibaba Wan 2.6 徹底 解説
押さえておきたいポイント
  • Wan2.6はAlibaba発のAI動画生成モデル。テキスト・画像・音声から動画を自動生成できる
  • 同じキャラクターを複数シーンで一貫して登場させる「R2V機能」が他モデルとの差別化ポイント
  • 公式WebUIとAPIの両方が利用可能。無料プランから試せる

企業のコンテンツ制作、特に動画の活用は、マーケティングや社内教育においてその重要性を増しています。しかし、専門的なスキルや高価な機材、そして多くの時間が必要となるため、多くの企業担当者が、その高いハードルに悩んでいるのではないでしょうか。

もし、テキストや簡単な指示だけで、プロ品質の動画を迅速に制作できるとしたら、ビジネスにどのような変革をもたらすでしょう。

本記事では、Alibaba Groupが開発した最新のAI動画生成モデル「Wan 2.6」をご紹介します。本稿が、貴社のコンテンツ制作における課題解決の一助となれば幸いです。

\生成AIを活用して業務プロセスを自動化/

目次

Wan 2.6の概要

Wan 2.6は、世界的なテクノロジー企業であるAlibaba Groupによって開発され、2025年12月に発表された最新のAI動画生成モデルシリーズです。近年、OpenAIの「Sora」やGoogleの「Veo」など、テキストから高品質な動画を生成するAIモデルの開発競争が激化しています。

このような市場背景の中、Alibabaはオープンソースのモデル(Wan 2.2など)でコミュニティに貢献しつつ、より高度で商業利用に特化した機能を持つWan 2.6を開発しました。従来の動画制作は、企画、撮影、編集、音声収録といった多くの工程を経て、専門的なスキルを持つチームが時間をかけて行うのが一般的でした。このプロセスは、コストと時間の両面で企業にとって大きな負担となり得ます。

Wan 2.6は、この課題を根本から解決することを目指す技術です。テキストによる指示(プロンプト)や、既存の画像・動画を基に、AIが自動で映像を生成します。これにより、動画制作の専門知識がない担当者でも、迅速かつ低コストで、一定品質の動画コンテンツを制作できるようになります。

特に、Wan 2.6は単なる動画生成に留まらず、参照した人物の容姿や声を維持したまま別のシーンを生成する「キャラクターキャスティング」機能を搭載しており、より一貫性のあるストーリー動画の制作を可能にしています。これは、従来のAI動画生成モデルでは難しかった、物語性のあるコンテンツ制作を容易にするものです。

なお、同じ中国発の動画生成AIであるKling AIについて、詳しく知りたい方は、下記の記事も併せてご確認ください。

Wan 2.6の仕組み

「AIが動画を作る」と聞いても、中身がブラックボックスでは導入判断が難しいもの。本章では、Wan 2.6がどんな仕組みで動いているのか、その全体像を紐解きます。

アーキテクチャと動作原理

Wan2.6の心臓部を覗いてみると、そこには単一の巨大なAIがいるわけではありません。むしろ、それぞれが得意分野を持つ専門家AIたちがチームを組んでいる、とイメージしていただくと分かりやすいかもしれません。このような、テキスト、画像、音声といった種類の異なる情報をまとめて扱えるシステムのことを「マルチモーダルAIシステム」と呼びます。

中心となっているのは、人間でいうところの「脳」にあたる巨大なニューラルネットワークです。このネットワークが、まるで翻訳家のように、言葉、映像、音という異なる言語を同時に理解し、それらを一つの動画という作品にまとめ上げていきます。

例えば、あなたが「夕暮れのオフィスで、部下に語りかける上司」というお題(テキストプロンプト)を投げかけたとします。すると、モデルはまず「夕暮れとはどんな光か」「オフィスとはどんな場所か」といった言葉の意味を考え始めます。次に、その言葉のイメージを、これまでに学習してきた膨大な映画やドラマのワンシーンと照らし合わせながら、「上司らしい人物像」や「オフィスにありそうな備品」といった具体的な映像のパーツを組み立てていきます。

さらに、「語りかける」という動きを再現するために、人物の自然な身振り手振りや、それに合わせたカメラの動き、窓から差し込む西日の当たり方といった要素を、まるで映画監督のように演出します。こうして出来上がった静止画を連続させることで、滑らかな動画が生まれるのです。

もし、ここに音声データを加えれば、モデルはさらにその能力を発揮します。話している内容に合わせて登場人物の口の動きをぴったりと合わせ(リップシンク)、映像と音声が完全に一体化した、よりリアルな動画を完成させます。

Wan 2.6 アーキテクチャ概要

構成モジュール

Wan 2.6を一つの「工房」に例えるなら、そこには腕利きの職人たちがそれぞれの持ち場で働いています。一人の万能職人がすべてをこなすのではなく、「参照動画の専門家」「テキスト解釈の達人」「画像加工のプロ」といった具合に、役割分担がされているのです。

この仕組みのおかげで、私たちは作りたいものに合わせて、適切な職人に仕事を依頼できます。以下の表で、それぞれの専門家がどんな仕事を得意としているか見てみましょう。

スクロールできます
モデル名機能主な役割
Wan2.6-R2V参照動画からの生成「この人物の顔や声はそのままで、別のシーンを作りたい」という時に活躍。キャラクターの一貫性を保ったまま、新しい場面を生み出せます。
Wan2.6-T2Vテキストからの動画生成頭の中にあるイメージを言葉で伝えるだけで、動画にしてくれます。「こんな映像が欲しい」をそのまま文章で指示するだけ。
Wan2.6-I2V画像からの動画生成お気に入りの1枚の写真やイラストに命を吹き込みたい時に。静止画が、まるで動き出したかのような映像になります。
Wan2.6-image画像の生成・編集動画の素材となる画像を作ったり、複数の画像を組み合わせて編集したりする、いわば「下ごしらえ」担当です。
モデル別機能一覧

面白いのは、これらの職人たちが連携プレーをできる点です。

たとえば、まず「Wan2.6-image」でオリジナルキャラクターの立ち絵を作成し、次にそれを「Wan2.6-I2V」に渡して歩かせる、といった流れ作業が組めます。一人で全部やるより、分業した方が効率も品質も上がる。Wan 2.6は、そんな考え方で設計されています。

Wan 2.6の特徴

AI動画生成の分野は競争が激化していますが、Wan 2.6は競合モデルと何が違うのでしょうか。本章では、その独自の強みと進化のポイントを解説します。

競合・類似サービスとの比較

AI動画生成の分野はまさに群雄割拠の時代ですが、その中でもWan 2.6は独自の位置を占めています。以下の表は、主要な競合モデルとの特徴を比較したものです。

スクロールできます
モデル開発元強み・特徴
Wan 2.6Alibabaキャラクターの一貫性(R2V機能)、音声同期、開発者向けの柔軟性
Sora 2 ProOpenAI物理法則の正確なシミュレーション、圧倒的なリアリズム、オブジェクトの永続性
Veo 3.1Google現実世界に忠実な描写、滑らかなカメラワーク、ブランドコンテンツ向けの安定した品質
Kling 2.6Kuaishouセリフや効果音を含むネイティブオーディオ生成、SNS向けの短い動画制作に強い
類似サービスとの比較

SoraやVeoが「現実世界を忠実に再現する」方向でリアリズムを追求しているのに対し、Wan 2.6は「特定のキャラクターを維持したまま物語を創る」というストーリーテリングの側面に強みを持っています。これは、企業が自社のマスコットキャラクターや特定の人物像を起用したブランディング動画、あるいは研修動画などを制作する際に、非常に有効な機能と言えるでしょう。

最新モデルと1世代前のモデルの比較

Wan 2.6は、オープンソースとして公開されていた前バージョンのWan 2.2/2.5から大きく進化しています。本モデルは、前バージョン(Wan 2.5)と比較して、キャラクターの一貫性を保つ参照動画からの生成機能が新たに追加され、より物語性の高い動画制作が可能になりました。

具体的には、Wan 2.5が単発のクリップ生成を得意としていたのに対し、Wan 2.6では複数のショットを組み合わせた一貫性のある動画(マルチショットストーリーテリング)の生成能力が向上しています。また、wan.video(公式Web)では最大15秒、外部API(fal.ai)ではT2VとI2Vが最大15秒、R2Vは最大10秒に延長され、より豊かな表現が可能になりました。

Wan 2.6の安全性・制約

新しいAIツールを社内に導入する際、情報システム部門の担当者として気になるのは「セキュリティは大丈夫か」「法的なリスクはないか」という点ではないでしょうか。Wan 2.6を提供するAlibabaも、この点については明確なルールを設けています。

利用時の制限・リスク

Wan 2.6の利用規約には、生成してはならないコンテンツが具体的に列挙されています。

企業として利用する場合、社員への周知も含めて把握しておくべき内容です。

スクロールできます
禁止カテゴリ具体的な内容
法律に抵触する行為児童の性的搾取に関わる素材の作成、他者のプライバシーを侵害する映像、暴力行為やテロを肯定・推奨するような内容
人を傷つける恐れのある内容自殺や自傷を美化・誘発するもの、特定の人種・性別・宗教などを標的にした差別的表現
人を騙す目的の内容詐欺に使われる映像、実在の人物になりすました動画、事実と異なる情報を広めるためのフェイク映像
専門領域での軽率な利用医師や弁護士といった専門家の確認を経ずに、医療診断や法的助言を行う動画の作成。電力・通信などの社会インフラに影響を与えかねない使い方
禁止事項一覧

これらの禁止事項に触れた場合、Alibabaはアカウントの一時停止や永久凍結といった対応を取る可能性があります。「AIが勝手に作ったものだから」という言い訳は通用しません。生成されたコンテンツをどう使うかの判断と責任は、あくまで利用者側にあります。

企業として導入を検討する際は、社内ガイドラインの整備や、利用者への教育も併せて計画しておくことをお勧めします。

セキュリティ対策

Alibaba側でも、Wan 2.6が悪意ある目的に使われないよう、複数の防御策を敷いています。一つは、モデル自体への「教育」です。

危険な指示や不適切な依頼が来た場合、それを拒否するようにAIを訓練しています。いわば、「こういう仕事は引き受けてはいけない」というルールを、AIの頭の中に刷り込んでいるわけです。

もう一つは、出力段階でのチェック機能です。仮にモデルが問題のある映像を生成しそうになっても、それを検知してブロックするフィルターが働きます。このフィルターは固定されたものではなく、新たな悪用パターンが発見されるたびにアップデートされています。

とはいえ、提供元の対策だけに頼り切るのは危険です。企業としてWan 2.6を導入するなら、自社のセキュリティポリシーとの整合性を確認し、「誰が」「どんな目的で」「どこまで使ってよいか」を明文化したガバナンス体制を整えておく必要があります。ツールを入れて終わりではなく、運用ルールとセットで考えることが、トラブルを未然に防ぐ鍵になります。

Wan 2.6の料金

Wan 2.6は、利用形態に応じて複数の料金プランが設定されています。

無料/有料プラン(Webインターフェース)

公式サイト「create.wan.video」では、サブスクリプション形式の料金プランが提供されています。

スクロールできます
プラン月額料金主な特徴
Free$0基本的な動画・画像生成(機能制限あり)2025年12月18日時点では、毎日150クレジット付与
Pro$5生成速度向上、ウォーターマークなし、月300クレジット付与
Premium$20さらなる速度向上、新機能への早期アクセス、月1200クレジット付与
料金プラン一覧

まずは無料プランで性能を確認し、必要に応じて有料プランへ移行するのが現実的です。

API課金と商用利用

自社で開発しているアプリやWebサービスにWan 2.6の動画生成機能を組み込みたい場合は、APIを利用する形になります。2025年12月18日時点では、Wan 2.6のAPIはfal.aiやReplicateといった外部のAIプラットフォームを通じて提供されています。料金体系は「使った分だけ払う」従量課金が主流で、動画の長さや解像度によって金額が変わってきます。

たとえば、720pの短い動画と1080pの長尺動画では、当然ながら後者の方がコストがかかります。事前に見積もりを立てやすいよう、各プラットフォームで料金シミュレーターが用意されていることも多いので、導入前に試算しておくとよいでしょう。有料プランやAPI経由で作成したコンテンツは、商用利用が認められています

Web広告のクリエイティブ、製品のプロモーション動画、SNSに投稿するショート動画など、ビジネスの現場で幅広く活用できます。ただし、何度も触れている通り、利用規約で禁止されている内容に抵触しないことが大前提です。「商用OKだから何でもあり」ではない点は、社内で共有しておく必要があります。

Wan 2.6のライセンス

Wan 2.6は商用モデルとして提供されており、利用にあたってはAlibabaが定める規約に従う必要があります。ここで注意したいのが、過去にリリースされたバージョンとの違いです。

たとえばWan2.2は、Apache 2.0というオープンソースライセンスの下で公開されています。

このライセンスは比較的自由度が高く、研究目的や個人的なプロジェクトであれば、かなり柔軟に使うことができます。実際、世界中の開発者やクリエイターがWan2.2を使って実験的な作品を作り、コミュニティで共有しています。

問題は、このオープンソース版の感覚をそのままWan 2.6に持ち込んでしまうケースです。「前のバージョンは自由に使えたから、新しいのも大丈夫だろう」と思い込んで商用プロジェクトに投入すると、ライセンス違反に該当する恐れがあります。

企業として導入を進める際は、「どのバージョンを」「どんな用途で」使うのかを明確にし、法務部門や知的財産の専門家に相談しながら進めることをお勧めします。利用規約は英語で書かれていることも多いため、翻訳や解釈に不安がある場合は、専門家の力を借りた方が安心です。後から「知らなかった」では済まされないのが、ライセンスの世界です。

Wan 2.6の実装方法

Wan 2.6の性能を体験するのに、複雑な環境構築は不要です。まずはWebブラウザだけで完結する、最も簡単な「公式サイトのプレイグラウンド」での使い方をご紹介します。

公式サイトのプレイグラウンド

最も手軽に、かつ無料で試せる方法です。Webブラウザだけで完結します。

  1. Wan AIの公式サイトにアクセスします。
  1. トップページの「Try Wan2.6 Now」というボタンをクリックします。
プレイグラウンドトップ画面
  1. アカウント登録を行い、ログインします。
プレイグラウンドアカウント登録画面
  1. ログインすると、プロンプトが入力できるようになります。
プレイグラウンドログイン後画面

ALT:

Wan 2.6の活用シーン

Wan 2.6の特性は、企業活動の様々な場面で応用できます。

スクロールできます
部門課題活用例
マーケティング・広告部門SNS向けの短尺動画を大量に、かつ迅速に制作したい。製品の画像や特徴をテキストで入力し、複数のパターンの広告動画を自動生成。ABテストを効率的に実施する。
人事・研修部門新入社員向けの研修コンテンツを、より魅力的で分かりやすいものにしたい。特定の案内役(アバター)を「Reference-to-Video」機能で設定し、一貫したキャラクターが登場するマニュアル動画やオンボーディングコンテンツを制作する。
製品開発・デザイン部門新製品のコンセプトやデザイン案を、静止画だけでなく動きのある形で関係者に共有したい。製品のデザイン画を基に、実際に製品が動いている様子や使用シーンを動画化し、企画会議でのプレゼンテーションに活用する。
社内広報部門社内イベントの告知や、経営層からのメッセージを、テキストだけの通知よりもインパクトのある形で伝えたい。イベントのテーマに合わせたイメージ動画や、経営者の写真と音声からメッセージ動画を生成し、社内ポータルで配信する。
部門別活用例一覧

なお、作成した動画をアニメ動画にすることができるDomoAIについて、詳しく知りたい方は、下記の記事も併せてご確認ください。

Wan 2.6を実際に使ってみた

実際にWan2.6の公式サイトにあるプレイグラウンドを使って、動画生成を試してみました。テキスト、画像、音声の3パターンで試行錯誤した結果と、気づいた点をご紹介します。

公式サイトのプレイグラウンド

  1. 中央下のプロンプト入力欄に「スマートウォッチの新CMを作成してください。」と入力し、実行してみました。

デフォルトで、Wan 2.6が選択されており、画質が720P、秒数が5秒でした。

プレイグラウンドプロンプト入力
  1. 実行すると、動画を作成し始めます。秒数が記載されているので、完了するまで待ちます。
プレイグラウンド動画作成中
  1. 作成が完了すると、動画が表示され、内容を確認することができます。
プレイグラウンド動画作成完了
  1. 次にベースとなる画像をセットし、画像をもとに作成させてみました。

プロンプトは、以下の様に英語で入力してみました。

Please create a new commercial introducing the attached smartwatch.

(和訳)

添付のスマートウォッチを紹介する新CMを作成してください。

  1. 画面下の「First Frame」に以下の画像をセットし、実行しました。
プレイグラウンドセット

英語でプロンプトを入力すると、英語のナレーションがつきました。

  1. 最後に音声と画像から動画を作成しました。

画面下の「Audio」から音声ファイルをセットします。

使用する音声ファイルは、以下になります。

画像は、上記と同様のスマートウォッチ画像です。

プレイグラウンド音声セット

動画の秒数的には、余裕がありましたが、音声が倍速で入ってしまいました。

設定時や音声作成時に何かしらの調整が必要なようです。

まとめ

AI動画生成モデル「Wan 2.6」の強みは、テキストから動画を作れるだけでなく、「同じキャラクターを複数シーンで一貫して登場させる」という従来のAIが苦手だった領域に踏み込んでいる点です。企業にとっては、動画制作の内製化によるコスト圧縮や、制作スケジュールの大幅な短縮が期待できます。

「作って、試して、直す」というサイクルを素早く回せるようになれば、マーケティングや社内コミュニケーションの質も上がるでしょう。もちろん、著作権や肖像権といった法的課題や、指示通りの映像が出ないこともあります。万能ではありません。ただ、リスクを理解した上で活用すれば、競合に先んじる武器になり得ます。

最後に

いかがだったでしょうか?

Wan 2.6やAI動画生成技術の導入に興味をお持ちの方は、ぜひ弊社までご相談ください。ツールの選定から運用体制の構築まで、貴社の状況に合わせてサポートいたします。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
無料相談

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • WEEL Media部

    株式会社WEELが運営する生成系AI関連メディア「生成AI Media」は、AIの専門家によるWebメディアです。 AIに特化した編集部がAIの活用方法、導入事例、ニュース、トレンド情報を発信しています。

  • URLをコピーしました!
  • URLをコピーしました!
目次