【Sora】世界に激震を与えたOpenAIの動画生成AI!実践レビュー&できること、仕組み、注意点を超詳しく解説

Sora OpenAI 動画生成AI
押さえておきたいポイント
  • 2024年12月9日に公開されたOpenAIの動画生成AI
  • テキスト・画像・動画から動画を生成
  • 最大20秒の動画を最短1分で作成可能
  • 解像度やアスペクト比など詳細設定が直感的に選択できる

WEELメディア事業部LLMライターのゆうやです。

みなさん!米国時間の2024年12月9日、ついにOpenAIが動画生成AI「Sora」を正式リリースしました!同年2月15日の発表から約10ヶ月経っての登場です。

正式リリース版のSoraは、ChatGPT感覚で手軽に動画生成・編集できるのが魅力。後発のライバルに負けないクオリティの動画が生成できて、編集機能もあわせると以下のような動画まで作れちゃいます。

当記事では、OpenAIの虎の子・Soraを徹底解説!その機能・技術・使い方・料金体系…etc.を余すところなくお伝えしていきます。

完読いただくと、すぐにでもSoraを使いこなせるようになっちゃう……かも。ぜひぜひ、最後までお読みください!

目次

Soraの概要

「Sora」はChatGPTでおなじみOpenAIが開発・リリースする動画生成AIです。2024年2月15日に発表・プレビュー版の公開がなされていて、同年12月9日についに正式リリース版「Sora(Sora Turbo)」が登場しました。

このSoraのすごいところとしては、複数の被写体とその動き、被写体と背景の位置関係を破綻させずに複雑なシーンを生成できることが挙げられます。発表から正式リリースまでの間に、同様の強みをもつ動画生成AIが次々とリリースされていますが、オリジナルはこのSoraです。

そんな動画生成AI Soraの特徴としては、

Soraのすごいところ・特徴
  • テキスト・画像・動画からの動画生成がChatGPT感覚で行える
  • 日本語のプロンプトにも完全対応
  • 動画のアレンジ・編集も直感的に行える
  • 一度に20秒の動画が生成できる
  • 2月のプレビュー版から生成速度がUP、たった1分で動画が作れる
  • ChatGPT Plus / ChatGPT Proのユーザーなら追加料金なしで使える
  • ウォーターマークやImage-to-Videoの制限等、著作権対策もバッチリ

以上のとおり。SoraはOpenAI曰く、単なる娯楽目的のAIツールではなく、現実世界を理解しシミュレートするための技術であるとのことです。

Soraの公式サイト:Sora

Soraの技術的な内容や、より深い内容を知りたい方は、こちらの記事をご覧ください。

Soraの機能を6つ紹介!

まずは、ついに登場した正式リリース版Soraの機能・できることを6点ご紹介します。以下、基本の動画生成から、詳しくみていきましょう!

動画生成

Soraでは、他の動画生成AIよりも直感的に、Text-To-Video(テキストから)/ Image-to-Video(画像から)/ Video-to-Video(動画から)の動画生成が可能。プロンプトの入力と画像・動画のアップロードが一度に行えるインターフェースを備えているため、ChatGPTと会話する要領で気軽に動画生成ができちゃいます。

さらに、Soraではプロンプトの送信直後から下記のとおり、動画の詳細仕様も設定可。他の動画生成AIと違って、ごちゃごちゃした設定欄が一度に表示されないようになっています。

Soraで指定できる動画の仕様
  • アスペクト比(16:9 / 9:16 / 正方形)
  • 解像度(480p / 720 / 1080p)
  • 動画の長さ(5秒 / 10秒 / 15秒 / 20秒)
  • 生成するバリエーションの数(1 / 2 / 4)

プロンプトの送信と詳細設定を終えた後はなんと、最長でもたった1分の待ち時間で動画1本の生成が完了します。終始ストレスフリーで動画生成ができそうです。

生成した動画の編集

Soraで生成した動画は、そのまま編集にかけることができます。編集の方法は簡単で、生成した動画のなかから好きなものを選んで、以下4つのオプションを適用するだけです。

編集オプション詳細・できること
Remix動画内の要素を置換・削除・再構築して新しい表現を生成
Re-cut動画の任意のフレームを使って動画を延長(後述のStoryboardが起動)
Loop動画をトリミングしてシームレスなループ動画を作成
Blend2つの動画をシームレスに結合

使いこなせれば、SNS用のショート動画が一瞬で用意できちゃうかもしれませんね。

Storyboard

Soraは、タイムライン上で思い通りの動画が作れる「Storyboard」機能も備えています。

  • タイムライン上での動画生成
  • 動画の切り貼り
  • 動画の延長
  • 動画・画像のアップロード
  • キャプションの追加

といった本格的な動画編集が可能。他の動画生成AIよりも、凝った動画が作れます。

Style presets内容
Cardboard & papercraft被写体や背景が段ボールや紙でできたペーパークラフトになる
Balloon World被写体や背景がバルーンアートになる
Stop Motion動画全体がコマ撮り風になる
Archival動画全体が昔のフィルムで撮影したような画質・深度になる
Film noir動画全体がヴィンテージ映画風の白黒映像になる

以上の5種類です。うまく使って、面白い動画を生成しちゃいましょう!

Library

Soraの画面左側サイドバーには、生成した動画の管理・整理整頓を助けてくれる「Library」機能が備わっています。こちらからは……

  • 生成した動画をお気に入り登録
  • 生成した動画をリンクで共有
  • 生成した動画をMP4形式でダウンロード
  • タイル表示 / リスト表示の切り替え
  • フォルダーの作成&動画の追加

といったことが可能です。

Explore

Soraの画面左側サイドバーからは、他のユーザーが生成した動画を閲覧できる「Explore」機能にもアクセス可。こちらでは、以下のようなことができます。

  • 最近投稿された動画を閲覧
  • OpenAIが選んだ秀逸な動画を閲覧(Featured Feed)
  • 動画の編集内容の表示
  • 動画のお気に入り登録
  • 他のユーザーが公開した動画の報告
  • 自分が公開した動画の削除

自分がSoraで動画を生成する際のインスピレーションが得られるかもしれませんね。

Soraの高品質な動画生成を実現している技術

ここからは、これまで紹介したようなSoraの機能を実現している技術について紹介します。

ここまで高性能なモデルはいったいどのような技術で成り立っているのでしょうか…?早速見ていきましょう!

ビジュアルデータのパッチ化

Soraでは、ビデオや画像をLLMのテキストトークンに似た小さなデータ単位であるビジュアルパッチパッチの集合として表現します。

パッチは、視覚データのモデルを効果的に表現することが先行研究で示されており、さまざまな種類のビデオや画像で生成モデルをトレーニングするための非常にスケーラブルで効果的な表現です。

引用元:https://openai.com/sora#capabilities

まず動画を低次元の潜在空間に圧縮し、次に表現を時空間パッチに分解することで、動画をパッチに変換します。

Video compression network

Video compression network(ビデオ圧縮ネットワーク)は、視覚データの次元を削減するネットワークで、生の動画を入力として受け取り、時間的および空間的に圧縮された潜在表現を出力します。

Soraは、このこの圧縮された潜在空間でトレーニングされ、その後、この圧縮された潜在空間内で動画を生成します。

Spacetime Latent Patches

Spacetime Latent Patches(時空潜在パッチ)は、圧縮された入力動画が与えられると、トランスフォーマートークンとして機能する一連の時空パッチを抽出します。

パッチベースの表現により、Sora はさまざまな解像度、長さ、アスペクト比のビデオや画像でトレーニングでき、推論時にランダムに初期化されたパッチを適切なサイズのグリッドに配置することで、生成されるビデオのサイズを制御できます。

ビデオ生成用のスケーリングトランスフォーマー

Sora はディフュージョンモデルであり、ノイズの多いパッチ (およびテキスト プロンプトなどの条件付け情報) が入力されると、元の「きれいな」パッチを予測するようにトレーニングされます。


引用元:https://openai.com/sora#capabilities

ここで重要なのは、Soraはディフュージョントランスフォーマーであり、これは言語モデリング、コンピュータビジョン、画像生成など、様々な領域で顕著なスケーリング特性を示してきました。

OpenAIは、ディフュージョントランスフォーマーが動画生成モデルとしても効果的であることを発見しました。

以下の例で、トレーニングの計算量が増えるにつれて、サンプルの品質は著しく向上することが示されています。

【Base】

【16倍】

言語理解

Soraは、DALL·Eの研究で得た成果、特にDALL·E 3からのキャプション再生成技術を応用し、非常に説明的なキャプションモデルをトレーニングし、次にそれを使用してトレーニングセット内のすべての動画のテキストキャプションを生成します。

高度に説明的なキャプションの訓練は、生成動画の全体的な品質だけでなく、テキストの忠実度を向上させることが分かっています。

また、GPTを活用して短いユーザープロンプトを長い詳細なキャプションに変換し、モデルに送信します。これにより、Soraはユーザーのプロンプトに正確に従った高品質の動画を生成することができます。

生成動画のラベリング

Soraでは正式リリースにあたって、Soraで生成した動画を識別するために以下2つの工夫がなされています。

  • 不可視のC2PAメタデータによる出所の証明(DALL-E 3に準拠)
  • ChatGPT Plusのみ、目に見える透かし・ウォーターマークの付与

ディープフェイクや盗作のリスクがある程度軽減されているといえるでしょう。

Soraの動画事例を知りたい方は、こちらの記事をご覧ください。

Soraの注意点

大幅に強化されてついに登場したSoraですが、まだまだ解決できていない注意点・課題が3つあります。まずは、著作権周りから詳しくみていきましょう!

人の著作物はアップロード不可

Soraでは、動画生成の参考用や切り貼りする用の画像・動画がアップロードできます。ただし規約上、以下に該当する人の著作物はアップロードができません。

  • 自分が著作権を有していない画像・動画
  • (フリー素材でも)必要な権利を全て取得していない画像・動画
  • 本人から書面によるアップロード許可を得ていない他人の画像・動画

Soraで動画生成をする際には、画像生成AIで用意したイラストや自分で撮影した写真&動画を使うとよいでしょう。

人物画像も当面アップロード不可

Soraについては十分な安全対策がなされていますが、それでもディープフェイクやポルノコンテンツの生成に悪用されるリスクが否定できません。

そのためSoraでは、リリース後から当面の間、人物画像・人物動画のアップロードが拒否されます。今後、ディープフェイク対策が整うにつれて、この制限は緩和されるようです。

複雑な動きの表現はまだ苦手

今回正式リリースされたSora(Sora Turbo)は、2月のプレビュー版と比べて、動画生成の能力が大幅UPしています。ただ、以下の課題については、今なお解決中とのことです。

  • 物理的性質の表現のエラー(例:ガラスが割れる様子を表現しづらい)
  • 複数の被写体が複雑に動く構図でのエラー(例:動く物体が動物や人に変形する)

今後、多くのユーザーがSoraを使うにつれて、エラーの解決に欠かせないフィードバックが集まってくるはず。Soraの成長を暖かく見守ってあげましょう!

Soraの料金プラン

Soraはリリース時点でChatGPTの一部有料プラン、ChatGPT Plus / ChatGPT Team / ChatGPT Proでのみ追加料金なしで使えます。(無料版ChatGPT / ChatGPT Enterprise / ChatGPT Edu / OpenAI APIでは利用不可) それぞれでの料金とSora周りの特典は、以下のとおりです。

スクロールできます
ChatGPT PlusChatGPT TeamChatGPT Pro
月額料金20ドル25ドル(年払い)/ 30ドル(月払い)200ドル
動画生成用クレジットの割当数1,000クレジット1,000クレジット10,000クレジット
1ヶ月に生成できる最大の動画数50本50本500本
一度に生成できる動画の長さ5秒 / 10秒5秒 / 10秒5秒 / 10秒 / 15秒 / 20秒
一度に生成できる動画の本数1本1本4本
動画の最大解像度480p / 720p480p / 720p480p / 720p / 1080p
ウォーターマークありありなし
レート制限ありありなし
その他特典・OpenAI o1 / OpenAI o1-mini /
GPT-4 Turboへのアクセス
・DALL-E 3での画像生成
・無制限のファイルアップロード
・Advanced Data Analysisの使用
・ChatGPT searchの使用
・Advanced Voice Modeの使用
・GPTsの作成
・新機能への早期アクセス
・Plusの特典
 +
・ワークスペースでのGPT作成&共有
・ワークスペースの管理
・入力データのオプトアウト
・Plusの特典
 +
・「o1 Proモード」へのアクセス
・OpenAI o1とGPT-4oの利用回数制限の廃止
・Advanced Voice Modeの利用回数制限の廃止

OpenAIによると今後(来年の上半期予定)、ChatGPTやSoraの利用料金はニーズに応じてカスタマイズできるようになっていくとのことです。Sora専用のリーズナブルな料金プランが出てくるかもしれませんね。

Soraの使い方

ここからは、正式リリース版Soraの使い方をスクリーンショット付きでご紹介します。まずは、Soraへのログイン手順から、みていきましょう!

ログイン

Soraへのログインは、Sora特設サイトから既存のChatGPT Plus / Team / Proアカウントを使って行えます。以下、その手順をみていきましょう!
Soraの特設サイトにアクセスすると、画面右上に「Log in」ボタンがあるはず。まずはそちらをクリックしてください。

するとメールアドレスの入力欄が現れます。

ここでは、ChatGPTで使っているメールアドレスの他、Googleアカウント / Microsoftアカウント / Appleアカウントでのログインも可能。今回はメールアドレスを入力して「続行」を押してみましょう!

メールアドレス入力後は、パスワードの入力画面が現れます。こちらもChatGPTのパスワードを入力して、「続ける」をクリックしてください。

一通り入力を終えるとログインが完了し、以下のとおりSoraのホーム画面が表示されるはずです。

次項からは、実際にSoraを使って動画生成を試してみましょう!

動画生成の方法

テキストからの動画生成

Soraの画面最下部にあるインターフェースからは、テキスト(英語のほか日本語もOK)での動画生成が可能。さらに、その下に並ぶボタンでは……

画像生成時に使えるボタン(右から順)
  • 画像・動画のアップロード欄(+)
  • 動画全体のトーン・エフェクト(Style presets)
  • 生成する動画のアスペクト比
  • 生成する動画の画質
  • 生成する動画の長さ
  • 一度に生成する動画のバリエーション数
  • タイムラインでの動画編集(Storyboard)
  • プロンプト送信(↑)

といったオプションも指定できちゃいます。

では早速、以下の条件をSoraに渡して、テキストからの動画生成を試してみましょう!

スクロールできます
設定項目詳細
プロンプト白い猫がオレンジを割って立ち上がって出てきて、
腰を振って踊っている様子。
動画全体のトーン・エフェクトBalloon World
生成する動画のアスペクト比1:1
生成する動画の画質480p
生成する動画の長さ5s
一度に生成する動画のバリエーション数1v

「↑」ボタンあるいはEnterキーでプロンプトを送信した後、しばらく待つと……

このように動画が生成されます。Soraが生成してくれた実際の動画は以下のとおりです。

見事、Soraはかなりアクロバティックな猫の動画を生成してくれています。ただ、首がねじれていたり、指定したとおりの動きではなかったりとエラーも目立つようす。入力するプロンプトは英語のほうがいいのかもしれませんね。

生成した動画の編集

さて、先ほどSoraで生成した動画をクリックしてみると……

このように画面下部に編集のオプションが現れます。ここでそれぞれのオプションを選んでできることは……

  • Edit prompt:プロンプトを変えて動画生成
  • View story:動画のタイムラインを確認
  • Re-cut:動画の一部を延長
  • Remix:プロンプトで動画を再構築
  • Blend:2つの動画から新たな動画を生成
  • Loop:動画の一部からループ動画を作成

以上のとおりです。

それではまず、この動画を使って「Remix」の手順をみていきましょう。ということで、Remixをクリックしてください。

するとこのように、Remix用の設定画面が現れるはず。ここではプロンプトの入力のほか、一度に生成するバリエーション数・画質・Remixの度合いが選べます。

とりあえず今回は、Strong Remixを選んで「白猫黒猫2匹で踊る」というプロンプトをSoraに渡してみましょう!プロンプトを送信後、しばらく待つと、

先ほどの動画に黒猫が追加されました。

続いては、今Remixした動画と元の動画を「Blend」で混ぜて、新たに1つの動画を生成してみます。ではまず、混ぜたい動画をクリックしたあと、画面下部のBlendから「Choose from library」を選択しましょう!

すると以下のとおり、Blendに使う動画が選べます。今回はここから、一番始めに生成した猫の動画を選んでみましょう。

2個目の動画を選ぶと、以下のとおりBlendの操作画面に移ります。ここでは曲線の範囲をマウス操作で調整することで、Blendの比率が変更可。さらに、画面下部・左から3番目のボタンをクリックしてみると……

以下のとおりBlend比のテンプレートが選べます。

このテンプレートから「Sample」を選んでみると……

以上のとおり、自動でいい感じの曲線が設定されています。あとは「Blend」をクリックするだけで、

白猫黒猫の動画と白猫単体のダンス動画が混ざって、新しい動画になっていますね。

今度は、Blendした動画を「Loop」でループさせてみます。ループさせたい動画を選択して、画面下部からLoopを選ぶと……

このように編集画面が開きました。ここでは、ループさせる範囲が指定できるほか、ループ動画の長さがShort(2秒)/ Normal(4秒)/ Long(6秒)から選べます。諸々の設定を済ませたあと、「Loop」をクリックすると、

このように、ループ動画が完成しました。

最後に、今用意したループ動画について、「Re-cut」でお気に入りのシーンを延長してみます。任意の動画で画面下部のRe-cutをクリックすると……

このように、タイムライン上でRe-cutで延長する範囲が選べます。試しに動画を前後に縮めて……

画面右下「↑Create」をクリックしてみましょう!

するとこのように、お気に入りの箇所を前後に伸ばした動画が返ってきます。

ちなみに、SoraのRe-cutでは動画→テキストへの逆変換も可能。その処理は……

以上のとおり「Convert to text」から行えます。試しにクリックしてみると、

動画の内容を説明した英文のプロンプトが返ってきていますね。

画像・動画からの動画生成

今度は、画像・動画からの動画生成についても方法をお見せします。まずは、動画生成用インタフェースの左下「+」をクリックしてみてください!

すると、このように画像・動画のアップロードにあたっての規約が表示されます。各チェック項目の内容は、

規約・同意事項の和訳
  • 本人の同意がない場合or18歳未満の人を含むメディアをアップロードしないことに同意する
  • 暴力や露骨な表現を含むメディアをアップロードしないことに同意する
  • アップロードするメディアに必要なすべての権利を有することに同意する
  • アップロードしたメディアを悪用した場合、アカウントが払い戻しなしに停止or削除されることがあることに同意する

以上のとおりで、かなり厳しい感じです。それぞれ理解した上でチェックを入れて「Accept」をクリックしましょう!

規約に同意すると、動画生成用インタフェースの左下「+」から、画像・動画がアップロードできるようになります。今度は猫の写真(ライターが撮影したもの)をアップロードして、以下の条件をSoraに渡してみましょう。

設定項目詳細
プロンプト猫が宇宙へロケットのように飛び立つ
動画全体のトーン・エフェクトStop Motion
生成する動画のアスペクト比16:9
生成する動画の画質480p
生成する動画の長さ5s
一度に生成する動画のバリエーション数1v

プロンプトを送信すると……

このように、元の画像をベースにした動画が生成されます。動きはリアルですが、やはり日本語だと命令がうまく反映されないようですね。

Storyboard

Soraでは、動画生成用インタフェースの右下「Storyboard」から、タイムライン形式の動画生成&編集が行えます。試しにクリックしてみましょう!

するとこのように、動画を貼り付けるためのカードが表示されます。このカードからは……

  • カード右下「+」(Add photo or video):Sora上の動画の選択 / 動画・画像のアップロード
  • カード中央テキストボックス(Describe this scene or add an image or video):プロンプトの入力
  • ゴミ箱:カードの削除

といったことが可能です。

それでは、試しに以下の設定をSoraに渡して、動画生成を行ってみます。

設定項目詳細
カード1の動画最初にテキストから生成した動画
(白い猫がオレンジを割って立ち上がって出てきて、腰を振って踊っている様子。)
カード2のプロンプトSanta’s sleigh flies gracefully over the town, with reindeer leading the way, leaving a sparkling trail in the night sky.
動画全体のトーン・エフェクトStop Motion
生成する動画のアスペクト比16:9
生成する動画の画質480p
生成する動画の長さ5s
一度に生成する動画のバリエーション数1v

気になる結果のほどは……

こんな感じ!被写体が猫というよりはネズミだったり、爆走していなかったりとツッコミどころは満載ですが、それなりの動画が返ってきていますね。

Soraでクリスマス動画を作ってみた!

Soraの「Storyboard」は、使い方次第で凝った動画が作れます。今回は以下の設定をSoraに入力して、クリスマスにぴったりなショートムービーを作ってみましょう!

設定項目詳細
カード1のプロンプト(0秒〜)On Christmas night, Santa Claus rides his sleigh across a snowy town under a starry sky. Santa, in his classic red outfit and white beard, carries a large sack of gifts. He smiles warmly as he delivers presents to children’s homes. His sleigh, pulled by reindeer, soars over houses glowing with cozy lights. The snow-covered rooftops and twinkling stars create a magical atmosphere, with Santa’s silhouette clearly visible against the night sky.
カード2のプロンプト(2秒〜)Santa’s sleigh flies gracefully over the town, with reindeer leading the way, leaving a sparkling trail in the night sky.
カード3のプロンプト(4秒〜)The final scene shows children waking up with joy and excitement as they discover the presents Santa left for them, surrounded by a warm, festive home environment.
動画全体のトーン・エフェクトNone
生成する動画のアスペクト比16:9
生成する動画の画質480p
生成する動画の長さ5s
一度に生成する動画のバリエーション数2v

Createをクリックすると……

まるでプロが編集したかのような動画が返ってきました。

やはり、プロンプトは英語で詳しく記述した方がよいようです。これなら、TikTokやYouYubeショート用の動画も簡単に作れちゃうかも。みなさんもぜひぜひ、お試しください!

Soraに今後実装されるかもしれない機能

最後に、Sora発表時にアナウンスされてはいたものの、正式リリース版には実装されていない機能について2つご紹介します。それぞれ今後Soraに実装されるかもしれないので、要チェックですよ!

画像生成

本来Soraは、画像を生成することもでき、最大 2048×2048 の解像度までさまざまなサイズの画像を生成できます。

Prompt: Close-up portrait shot of a woman in autumn, extreme detail, shallow depth of field

訳: 秋の女性のクローズアップ・ポートレート、極端なディテール、浅い被写界深度

https://openai.com/sora#capabilities

画像生成AIとしても使用でき、動画にとどまらない高い汎用性を持っているんです!

新しいシミュレーション能力

Soraには、これまでの動画生成AIにはなかったようなシミュレーション能力があるといわれてます。

例えば、以下の動画のように、カメラが移動したり回転したりすると、人物やシーンの要素が 3 次元空間内を一貫して移動する動画が生成可能です。

また、ユニークな能力として、人工的なプロセスをシミュレートすることもできます。その一例として、ゲーム「Minecraft」のシミュレートが紹介されています。

Soraは、以下の動画のようにMinecraftのプレイヤーをコントロールすると同時に、世界とそのダイナミクスを忠実にレンダリングすることができるんです。

【プレイ動画】

【Soraによるシミュレーション】

なんなら本物のMinecraftよりリアルな映像ですよね!

そして、この機能は、「Minecraft」について言及するキャプションをソラに促すことでゼロショットで引き出すことができます。

このシミュレーション動画をテキスト入力のみで生成できるとは驚きです。

Soraのこの機能は、ビデオ モデルの継続的なスケーリングが、物理世界とデジタル世界、およびその中に住む物体、動物、人々の高機能シミュレーターの開発に向けた有望な道であることを示唆しています。

なお、AGIについて詳しく知りたい方は、下記の記事も合わせてご確認ください。

Soraは他のモデルとは一線を画す超高性能動画生成AIモデル!

Soraは、2024年2月15日に発表されて同年12月9日に正式リリースされたOpenAI社動画生成AIモデルで、現実と見分けがつかないほどリアルで高精細な動画を生成してくれます。

最後に、そんなSoraの特徴をまとめます。

  • テキストから動画への変換: Soraは、テキストプロンプトに応答して超高品質の動画を作成する能力を持っています。
  • ビデオ生成用のスケーリングトランスフォーマー:Soraはディフュージョントランスフォーマーであり、これは動画生成モデルとしても有用で、トレーニングの計算量に応じて著しく性能が向上します。
  • Text-To-Video以外の機能:Soraには、生成された動画の拡張、動画の編集、動画の接続、画像生成などのText-To-Video以外の機能も充実しています。
  • 他のモデルの技術の応用:Soraは、DALL·E 3からのキャプション再生成技術を応用し、トレーニングセット内のすべての動画のテキストキャプションを生成します。また、GPTをGPTを活用して短いユーザープロンプトを長い詳細なキャプションに変換します。

OpenAI曰く、「Sora は、現実世界を理解してシミュレーションできるモデルの基盤にして、 AGI を達成するための重要なマイルストーンである」のこと。

このモデルが生成する動画や機能を見せられたら、私たちが想像しているよりも早くAGIが実現してしまうのではないかと期待してしまいますね!

最後に

いかがだったでしょうか?

動画生成AIを事業にどう活かせるか、具体的な活用方法や効果的な導入事例を元に専門家が最適なソリューションをご提案します。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
無料相談

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • ゆうや

    ロボット工学専攻。 大学時代は、対話ロボットのための画像キャプションの自動生成について研究。 趣味は、サウナとドライブ。

  • URLをコピーしました!
  • URLをコピーしました!
目次