【Veo】高性能な動画生成AIが誕生!Googleが公開した動画生成AIの実力とは?
WEELメディア事業部リサーチャーのいつきです。
突然ですが、みなさんは動画生成AIの「Veo」をご存知でしょうか。
「Veo」はGoogleが開発者向けイベント「Google I/O 2024」で発表した新たな動画生成AIで、なんと1分を超える動画をフルHDの画質で生成できるとのこと。
そこで今回は、気になる「Veo」の概要や実際に「Veo」で生成された動画をいくつかご紹介します。
最後までご覧いただくと、動画生成AIの進化の軌跡を追えるので、自社業務にいち早く取り入れられるかもしれません。ぜひ最後までご覧ください。
Veoとは
「Veo」は、Google DeepMindが開発した動画生成AIです。テキストtoビデオやイメージtoビデオの形式でプロンプトを反映して、1分を超える動画の生成も可能にしています。
なお、画質はフルHDに対応しているので、綺麗な映像を作れるのが特徴。また、自然言語と視覚的セマンティクスの理解に長けているため、複雑なプロンプトも理解できます。
ほかにも、以下のような特徴があります。
- マスク編集機能で部分的に編集できる
- 画像とテキストを組み合わせて動画を生成できる
- SynthIDが埋め込まれる(AI生成動画であることがわかる)
とくに、マスク編集機能を備えているのが嬉しいポイントです。たとえば、以下のようにアルパカの動画を生成したあと、モデルや服装は変えずに動きだけを指定できます。
使いこなせば、生成AIで高レベルの動画を生成できるようになるので、ぜひ利用してみてください。
まずは、VideoFXを通じて一部のクリエイターが利用できるようになるとのことです。
なお、OpenAIが開発した「Sora」について詳しく知りたい方は、下記の記事を合わせてご確認ください。
Veoで生成した動画
ここでは、実際にVeoで生成した動画を9個ご紹介します。
- ネオン煌く街でのレース
- クラゲ
- 睡蓮の開花
- カウボーイとウマ
- 宇宙船
- 本を読む女性
- バーベキュー
- 雪山と湖
- 山道を歩くゴールデンレトリバー
動画の出来栄えなどを解説していくので、ぜひ参考にしてみてください。
ネオン煌く街でのレース
まずは、ネオン煌く街を舞台に、レースを繰り広げている動画です。
公式サイトにプロンプトが公開されていたので共有します。
A fast-tracking shot through a bustling dystopian sprawl with bright neon signs, flying cars and mist, night, lens flare, volumetric lighting.
A fast-tracking shot through a futuristic dystopian sprawl with bright neon signs, starships in the sky, night, volumetric lighting.
A neon hologram of a car driving at top speed, speed of light, cinematic, incredible details, volumetric lighting.
The cars leave the tunnel, back into the real world city Hong Kong.
明るいネオンサイン、空飛ぶ車と霧、夜、レンズフレア、立体的な照明を備えたにぎやかなディストピアの広がりを通る高速追跡ショット。
明るいネオンサイン、空の宇宙船、夜、立体的な照明を備えた未来的なディストピアの広がりを通る高速追跡ショット。
最高速度、光の速度、映画のような、信じられないほどのディテール、立体的な照明で走行する車のネオン ホログラム。
車はトンネルを出て、現実世界の都市香港に戻ります。
長文のプロンプトであるにもかかわらず、しっかりと動画に反映できていることがわかりますね。
まるで映画の1シーンのように、幻想的な動画に仕上がっています。
クラゲ
次は、水中にいるクラゲの動きをとらえた動画です。
Many spotted jellyfish pulsating under water. Their bodies are transparent and glowing in deep ocean
多数の斑点のあるクラゲが水中で脈動しています。彼らの体は透明で深海で光ります
1つ目の動画と比較するとかなりシンプルなプロンプトですが、それでも完成度の高い動画に仕上がっています。
今回の動画は8秒なので、動画の長さとプロンプトの量は比例するのかもしれません。
言われなければAI生成動画だと気づかないくらいリアルなクラゲを表現できているので、さまざまな使い道がありそうです。
睡蓮の開花
今度は、睡蓮が開花する様子をAI生成動画で表現しています。
Timelapse of a water lily opening, dark background.
スイレンの開花のタイムラプス、暗い背景
今回のプロンプトでは、睡蓮が開花するというシーンの指定と、背景を指定しているのが特徴です。こちらの動画もプロンプトがシンプルですが、やはりリアルな映像に仕上がっています。
動画の長さは2つ目の動画と同じ8秒なので、プロンプトが短いことと関係がありそうです。
カウボーイとウマ
カウボーイが馬に乗って、平原を駆けている動画です。
A lone cowboy rides his horse across an open plain at beautiful sunset, soft light, warm colors.
美しい夕暮れ、柔らかな光、暖かな色彩の中、広々とした平原を馬で駆け抜ける一人のカウボーイ。
今回の動画では、時間帯・光の加減・色・場所と複数の要素を指定しますが、すべてしっかり反映されています。映画の予告動画などで使えそうなクオリティに仕上がっていますね。
宇宙船
宇宙船が宇宙を疾走している動画です。
A spaceship hurdles through the vastness of space, stars streaking past as it, high speed, sci-fi.
宇宙船が広大な宇宙空間を疾走し、星々が通り過ぎる。
こちらもシンプルなプロンプトですが、しっかりとクオリティの高い動画に仕上がっています。
「星々が通り過ぎる」というプロンプトを反映できているのか微妙なところですが、確かに後半は奥に微かに星が見えています。
本を読む女性
こちらの動画では、本を読む1人の女性を映しています。
A woman sitting alone in a dimly lit cafe, a half-finished novel open in front of her. Film noir aesthetic, mysterious atmosphere. Black and white.
薄暗いカフェに一人座り、目の前には読みかけの小説。フィルムノワールの美学、ミステリアスな雰囲気。モノクロ。
こちらも8秒の短い動画ですが、プロンプトの内容をしっかり表現しています。
とくに、ミステリアスな雰囲気やモノクロの見た目を再現できている点に注目です。雰囲気などは曖昧な要素ですが、動画にしっかり反映できているあたり、Veoのプロンプトに対する理解力の高さが伺えます。
バーベキュー
次の動画は、バーベキューで焼き鳥を焼いている動画です。
Extreme close-up of chicken and green pepper kebabs grilling on a barbeque with flames. Shallow focus and light smoke. vivid colours.
バーベキューで炎とともに焼かれるチキンとピーマンのケバブの極端なクローズアップ。浅い焦点と軽い煙。鮮やかな色彩。
今回の動画では、チキンとピーマンといった対象だけでなく、カメラの視点まで指定しています。プロンプトのとおりにクローズアップされているので、よりバーベキューの臨場感が伝わる動画になっていますね。
色彩も鮮やかで、見るだけでお腹が空きそうな見た目をしています。
雪山と湖
こちらの動画では、雪山と湖を映し出しています。
A panning shot of a serene mountain landscape, the camera slowly revealing snow-capped peaks, granite rocks and a crystal-clear lake reflecting the sky.
静寂に包まれた山の風景のパンニングショットで、カメラは雪を頂いた峰々、花崗岩の岩、空を映す透き通った湖をゆっくりと映し出す。
今回の動画でも、雪を頂いた峰々・花崗岩の岩・空を映す透き通った湖など、複数のプロンプトをしっかり反映できています。
とくに、湖に空が映っているので、綺麗な映像に仕上がっていますね!
山道を歩くゴールデンレトリバー
山道を歩くゴールデンレトリバーも動画化されていたのでご紹介します。
A golden retriever walks on a winding mountain trail, its tail wagging excitedly as it explores the sights and scents of the wilderness.
ゴールデンレトリバーが曲がりくねった山道を歩き、大自然の景色や香りを探検しながら尻尾を振って興奮している
こちらの動画も、曲がりくねった山道や尻尾を振っているという要素を満たしており、想定通りの動画が作れているとわかります。
とくに、ゴールデンレトリバー特有のふさふさの毛並みを再現できているのが好印象です。
Veoの注意点
高品質な動画を生成できるVeoですが、利用する際には以下3つの注意点があります。
- 現時点で一般公開はされていない
- 日本語入力ができるか不明
- 著作権侵害のリスク
とくに、日本語入力できるかどうかというのは大きなポイントだと思います。
以下でそれぞれの注意点を詳しく解説するので、ぜひ参考にしてみてください。
現時点で一般公開はされていない
2024年5月現在、Veoは一般公開されていないため、基本的には利用できません。
現時点では、Googlwのお試しサービス「Labs.google」のテスター待機リストとして専用フォームからの応募のみが受け付けられています。
これについては、公式サイトにも記載があり、まずは一部のクリエイター向けにテスト公開すると発表しています。
ただ、将来的には、Veo の機能の一部をYouTube ショートやその他の製品にも導入する予定とのことです。
日本語入力ができるか不明
Veoの対応言語は現状公開されていないため、日本語入力ができるかも不明です。もし日本語入力に対応できないとなると、一旦日本語を英語に翻訳する手間が発生するので効率が悪くなります。
ただ、英語のみに対応しているAIツールは珍しくないので、英語に慣れておくいい機会と捉えるべきかもしれません。
公式からの発表やVeoが正式に公開され次第、情報を追記しますね。
著作権侵害のリスク
Veoに限らず、生成AIを利用する際は著作権侵害のリスクをケアすることが大切です。生成動画に他人の著作物が含まれていると訴えられる可能性があるので、公開前のチェックは欠かせません。
なお、VeoにはSynthIDや安全フィルターなど、プライバシー・著作権リスクの軽減策を導入しています。それでも、著作権を侵害してしまう可能性が完全になくなるわけではないので十分注意しましょう。
なお、生成AIを企業利用するリスクについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
Veoで高品質な動画を生成しよう!
Google DeepMindが開発した動画生成AIの「Veo」は、1分以上の動画をフルHD画質で生成できるなど、かなり高い能力を備えています。
実際に、生成された動画を調査したところ、以下のような動画が投稿されていました。
- ネオン煌く街でのレース
- クラゲ
- 睡蓮の開花
- カウボーイとウマ
- 宇宙船
- 本を読む女性
- バーベキュー
- 雪山と湖
- 山道を歩くゴールデンレトリバー
動画生成の精度が高く、かなり利便性の高い生成AIですが、利用する際は以下の3点に注意が必要です。
- 現時点で一般公開はされていない
- 日本語入力ができるか不明
- 著作権侵害のリスク
正式に一般公開される時期は不透明ですが、まずはVideoFXを通じて一部のクリエイター向けに提供するとのことなので、早く使ってみたい方はウェイティングリストに応募しましょう。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。