【Vidu】Soraを超える動画生成AI!?商用利用や使い方などを徹底解説!
今話題のViduという動画生成AIをご存知でしょうか? このViduは中国発の動画生成AIで、あのOpenAIのSoraよりも高性能なのではないかということで注目を集めています。
- アニメ風やリアル風など、複数のスタイルに対応
- 複数キャラクターが登場する動画でも、一貫性のあるクオリティを実現
- 4秒の動画を約1分で生成し、短時間でのコンテンツ制作が可能
- U-ViT(Universal Vision Transformer)と呼ばれる独自の技術を採用
今回は、そんなViduの使い方や料金プラン、商用利用の有無などについて解説します。実際にViduを使って出力した動画もご紹介しているので、ぜひ最後までお読みください!
Viduとは
Viduとは、中国のIT企業である生数科技(Shengshu Technology)と清華大学が共同で開発した動画生成AIで、U-ViT(Universal Vision Transformer)と呼ばれる独自の技術が用いられていることから、高品質な動画を生成することができます。
Viduは英語と中国語のみの表記となっていますが、直感的に操作ができるようなUIになっているため、翻訳機能を使えば誰でも簡単に利用できるように設計されています。
また、アニメ風やリアル風などスタイル変更も簡単にできるので、簡単に幅の広い動画を生成できると今話題になっている動画生成AIの1つです。
なお、SNSで話題になった動画生成AIついて詳しく知りたい方は、下記の記事を合わせてご確認ください。
Viduの特徴
前述の通り、ViduはU-Vitと呼ばれる技術を用いて構築されています。
この、U-ViTを簡単に説明すると、大まかな画像から徐々に細部を書き足していく「拡散モデル」と、ChatGPTのベースにもなっている正確な文脈理解を可能にする「トランスフォーマーモデル」という2つのAIモデルを統合した技術で構築されています。
これにより、よりリアルでダイナミックな動画を生成することが可能となりました。
こちらのXのポストの動画は、Viduを使って生成されています。
内容的には、アニメのオープニングのような構成になっていますが、キャラクターやモンスターの表情のリアルさはもちろん、背景まで細かく描写されていたり、炎や煙、涙といったエフェクトも綺麗に表現れていたりと、Viduの特徴であるリアルでダイナミックな動画が生成されていることがわかります。
今回紹介した動画はアニメ風の描写になっていますが、Viduではリアル風なスタイルの動画も生成できるので、幅広い動画を生成できるのも特徴の1つと言えるでしょう。
Viduの使い方
次に、Viduの使い方について説明します。
まずは、公式サイトへアクセスします。
アクセスすると上記の画面が表示されるため、右上にある「Try Vidu」をクリック。
クリックしたらアカウント作成方法を行います。
ログインの方法は、Googleアカウントかメールアドレスの2種類になるので、好きな方を選択してください。
今回は、Googleアカウントを使って登録を進めていきますので、「Continue with Google」をクリックします。
次にViduで利用するGoogleアカウントをクリック。その後、利用規約の確認画面が表示されるため、「次に」ボタンを押して登録は完了です。
登録が完了して、上記のページに移動したらいよいよViduが利用できます。
Viduでできることは、下記の通りです。
- Image to Video:1枚の画像とテキストプロンプトから動画を生成
- Reference to Video:最大3枚の画像とテキストプロンプトから動画を生成
- Text to Video:テキストプロンプトのみで動画を生成
この生成方法に切り替える場合は、画面左上の赤枠から選択してください。
基本的に直感的に利用できるような仕組みになっているので難しいことはないですが、ツールの言語が英語と中国語しか選択できないため、適宜翻訳ツールを活用しながら利用するのが良いでしょう。
Viduを使ってみた!
では、実際にViduを使って動画を生成してみましょう。
まずは、Reference to Video機能を使って動画を作ってみます。
今回は、「男性」と「女性」、「橋の間から塔が見える背景」の3枚の画像を使用して動画を生成してみます。
Reference to Videoで動画を生成する場合は、画像をアップロードするだけでは動画を生成できないので、テキストプロンプトも入力していきます。
入力したテキストプロンプトは下記の通りです。
One man, one woman, talking under the bridge
その他、設定については初期設定のまま生成してみました。生成された動画はこちら。
男性については、元画像からしっかり特徴を捉えて上手に再現されていますが、女性に関しては全くの別人になってしまいました。
背景に関しても、石造りの建物や塔は表現されているものの、アップロードした橋の画像や「under the bridge」というテキストプロンプトは再現されない結果となりました。
しかし、画像を3枚用意し簡単なテキストプロンプトを加えるだけで、このクオリティの動画を生成することができるので、テキストプロンプトの調整や利用画像の選定などを研究すれば、短編映画など作れてしまうのではないでしょうか。
次に、Text to Videoで動画を生成してみます。
Text to Videoでは、プロンプト入力欄にある「Inspire Me」を活用して動画を生成してみます。
Inspire Meとは、簡単に説明するとVidu側が自動でプロンプトを考えてくれる機能で、これを使うことによってテキストプロンプトの入力方法がわからない方の見本になったり、新しいプロンプトを発見できるなどさまざまなメリットがあります。
Inspire Meの使い方はとても簡単で、テキストプロンプト入力欄にある「Inspire Me」を押すだけでOK。
今回はInspire Meで生成されたこちらのプロンプトを使って動画を出力します。
Frame an intense conversation in a dimly lit train compartment. Begin with a close-up of a ticking pocket watch, then pull back to reveal two characters seated opposite each other, the tension palpable. Employ a Hitchcock shot by using reflective surfaces like the window next to them to show fleeting reflections of concerned expressions. The lighting is subdued, with occasional flashes from passing lights punctuating the dialogue, creating shadows that play across their faces. This technique crafts a claustrophobic, high-stakes atmosphere typical of Hitchcock’s thrillers.
設定は、スタイルを「Animation」に変更し、それ以外は初期設定のままで生成してみます。
生成された動画は下記の通りです。
これはすごい! 時計や後半の二人の描写はもちろん、前半の時計のシーンから後半の二人へシーンが移り変わるところもとても自然で、まるでアニメのワンシーンのような動画を生成することができました。
どこか、90年代のアメコミを彷彿とさせる画風もおしゃれで、もっと細かくプロンプトを調整すれば、希望通りの動画を生成することができる可能性があるので、今後、動画生成AIがアニメ制作の中心になる可能性を感じました。
Viduの料金プラン
2024年11月22日現在では、フリープランを含む4つのプランが展開されています。
それぞれの料金や機能の違いについては下記の通りです。
プラン名 | 料金 | クレジット数 | 生成できるビデオの長さ | 透かし | 解像度のアップスケール | 同時にこなせるタスクの数 |
---|---|---|---|---|---|---|
Free | 0ドル /月 | 80クレジット/月 | 4秒 | あり | 不可 | 1つ |
Standard | 7.99ドル /月 | 320クレジット/月 | 4秒or8秒 | なし | 可能 | 2つ |
Advanced | 23.99ドル /月 | 880クレジット/月 | 4秒or8秒 | なし | 可能 | 3つ |
Premium | 79.99ドル /月 | 2360クレジット/月 | 4秒or8秒 | なし | 可能 | 4つ |
表を見ていただければわかる通り、無料のFreeプランと有料のその他プランでは、できることや透かしの有無などが大きく変わってきますが、有料の3つのプランを比較してみるとそこまで大きな違いはありません。
なので、有料プランに加入する場合は、生成したい動画の数をあらかじめ把握しておくことで、最適なプランを選ぶことができるでしょう。
Viduの商用利用について
商用利用に関しては、無料のFreeプランでは許可されていませんが、Standardプラン以上の有料プランでは商用利用が許可されています。
前述の通り、Standardプラン以上であれば、利用できる機能には大きく変わりはありません。
大きな違いといえば付与されるクレジット数だけなので、プロジェクトで利用する場合はプロジェクトの規模や動画を生成する頻度を事前に考えた上で、有料プランに加入することをお勧めします。
なお、OpenAIのSoraの使い方について詳しく知りたい方は、下記の記事を合わせてご確認ください。
Viduを活用してみよう!
今回、実際にViduを使ってみましたが、本当に簡単に高品質な動画を生成できたことに驚きました。
無料プランでは、透かしが入ったり解像度をあげることができなかったりとさまざまな制限はありますが、生成される動画は基本的には変わらないため、無料でViduの性能を試すことができるのも嬉しいポイントです。
動画生成AIの利用用途はさまざまですが、Viduは高画質で高性能な動画を簡単に作りたいという方におすすめできる動画生成AIと言えるでしょう。
動画生成AIをお探しの方は無料プランでもいいので、試しにViduを使ってみてはいかがでしょうか。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
生成AIを活用した動画制作で、効率化と高品質を両立したい企業様へ。Viduなどの活用事例や商用利用のポイントを踏まえ、貴社に最適な導入方法をご提案いたします。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。