Open AIの動画生成AI「Sora」とは?使い方や機能を解説

- 2024年12月9日に公開されたOpenAIの動画生成AI
- テキスト・画像・動画から動画を生成
- 最大20秒の動画を最短1分で作成可能
- 解像度やアスペクト比など詳細設定が直感的に選択できる
WEELメディア事業部LLMライターのゆうやです。
みなさん!米国時間の2024年12月9日、ついにOpenAIが動画生成AI「Sora」を正式リリースしました!同年2月15日の発表から約10ヶ月経っての登場です。
正式リリース版のSoraは、ChatGPT感覚で手軽に動画生成・編集できるのが魅力。後発のライバルに負けないクオリティの動画が生成できて、編集機能もあわせると以下のような動画まで作れちゃいます。
当記事では、OpenAIの虎の子・Soraを徹底解説!その機能・技術・使い方・料金体系…etc.を余すところなくお伝えしていきます。
完読いただくと、すぐにでもSoraを使いこなせるようになっちゃう……かも。ぜひぜひ、最後までお読みください!
Open AI Soraの概要
「Sora」はChatGPTでおなじみOpenAIが開発・リリースする動画生成AIです。2024年2月15日に発表・プレビュー版の公開がなされていて、同年12月9日についに正式リリース版「Sora(Sora Turbo)」が登場しました。
このSoraのすごいところとしては、複数の被写体とその動き、被写体と背景の位置関係を破綻させずに複雑なシーンを生成できることが挙げられます。発表から正式リリースまでの間に、同様の強みをもつ動画生成AIが次々とリリースされていますが、オリジナルはこのSoraです。
そんな動画生成AI Soraの特徴としては、
- テキスト・画像・動画からの動画生成がChatGPT感覚で行える
- 日本語のプロンプトにも完全対応
- 動画のアレンジ・編集も直感的に行える
- 一度に20秒の動画が生成できる
- 2月のプレビュー版から生成速度がUP、たった1分で動画が作れる
- ChatGPT Plus / ChatGPT Proのユーザーなら追加料金なしで使える
- ウォーターマークやImage-to-Videoの制限等、著作権対策もバッチリ
以上のとおり。SoraはOpenAI曰く、単なる娯楽目的のAIツールではなく、現実世界を理解しシミュレートするための技術であるとのことです。
Soraの公式サイト:Sora
動画生成AIについて詳しく知りたい方は、こちらの記事をご覧ください。

Open AI Soraの機能を7つ紹介!
まずは、ついに登場した正式リリース版Soraの機能・できることを7点ご紹介します。
- 動画生成
- 生成した動画の編集
- Storyboard
- Library
- Explore
- 画像生成
- 新しいシミュレーション
以下、基本の動画生成から、詳しくみていきましょう!
動画生成
Soraでは、他の動画生成AIよりも直感的に、Text-To-Video(テキストから)/ Image-to-Video(画像から)/ Video-to-Video(動画から)の動画生成が可能。プロンプトの入力と画像・動画のアップロードが一度に行えるインターフェースを備えているため、ChatGPTと会話する要領で気軽に動画生成ができちゃいます。
さらに、Soraではプロンプトの送信直後から下記のとおり、動画の詳細仕様も設定可。他の動画生成AIと違って、ごちゃごちゃした設定欄が一度に表示されないようになっています。
- アスペクト比(16:9 / 9:16 / 正方形)
- 解像度(480p / 720 / 1080p)
- 動画の長さ(5秒 / 10秒 / 15秒 / 20秒)
- 生成するバリエーションの数(1 / 2 / 4)
プロンプトの送信と詳細設定を終えた後はなんと、最長でもたった1分の待ち時間で動画1本の生成が完了します。終始ストレスフリーで動画生成ができそうです。
生成した動画の編集
Soraで生成した動画は、そのまま編集にかけることができます。編集の方法は簡単で、生成した動画のなかから好きなものを選んで、以下4つのオプションを適用するだけです。
編集オプション | 詳細・できること |
---|---|
Remix | 動画内の要素を置換・削除・再構築して新しい表現を生成 |
Re-cut | 動画の任意のフレームを使って動画を延長(後述のStoryboardが起動) |
Loop | 動画をトリミングしてシームレスなループ動画を作成 |
Blend | 2つの動画をシームレスに結合 |
使いこなせれば、SNS用のショート動画が一瞬で用意できちゃうかもしれませんね。
Storyboard
Soraは、タイムライン上で思い通りの動画が作れる「Storyboard」機能も備えています。
- タイムライン上での動画生成
- 動画の切り貼り
- 動画の延長
- 動画・画像のアップロード
- キャプションの追加
といった本格的な動画編集が可能。他の動画生成AIよりも、凝った動画が作れます。
Style presets | 内容 |
---|---|
Cardboard & papercraft | 被写体や背景が段ボールや紙でできたペーパークラフトになる |
Balloon World | 被写体や背景がバルーンアートになる |
Stop Motion | 動画全体がコマ撮り風になる |
Archival | 動画全体が昔のフィルムで撮影したような画質・深度になる |
Film noir | 動画全体がヴィンテージ映画風の白黒映像になる |
以上の5種類です。うまく使って、面白い動画を生成しちゃいましょう!
Library
Soraの画面左側サイドバーには、生成した動画の管理・整理整頓を助けてくれる「Library」機能が備わっています。こちらからは……
- 生成した動画をお気に入り登録
- 生成した動画をリンクで共有
- 生成した動画をMP4形式でダウンロード
- タイル表示 / リスト表示の切り替え
- フォルダーの作成&動画の追加
といったことが可能です。
Explore
Soraの画面左側サイドバーからは、他のユーザーが生成した動画を閲覧できる「Explore」機能にもアクセス可。こちらでは、以下のようなことができます。
- 最近投稿された動画を閲覧
- OpenAIが選んだ秀逸な動画を閲覧(Featured Feed)
- 動画の編集内容の表示
- 動画のお気に入り登録
- 他のユーザーが公開した動画の報告
- 自分が公開した動画の削除
自分がSoraで動画を生成する際のインスピレーションが得られるかもしれませんね。
画像生成
本来Soraは、画像を生成することもでき、最大 2048×2048 の解像度までさまざまなサイズの画像を生成できます。※1
Prompt
Close-up portrait shot of a woman in autumn, extreme detail, shallow depth of field
訳: 秋の女性のクローズアップ・ポートレート、極端なディテール、浅い被写界深度

画像生成AIとしても使用でき、動画にとどまらない高い汎用性を持っているんです!
新しいシミュレーション
Soraには、これまでの動画生成AIにはなかったようなシミュレーション能力があるといわれてます。
例えば、以下の動画のように、カメラが移動したり回転したりすると、人物やシーンの要素が 3 次元空間内を一貫して移動する動画が生成可能です。
また、ユニークな能力として、人工的なプロセスをシミュレートすることもできます。その一例として、ゲーム「Minecraft」のシミュレートが紹介されています。
Soraは、以下の動画のようにMinecraftのプレイヤーをコントロールすると同時に、世界とそのダイナミクスを忠実にレンダリングすることができるんです。
【プレイ動画】
【Soraによるシミュレーション】
なんなら本物のMinecraftよりリアルな映像ですよね!
そして、この機能は、「Minecraft」について言及するキャプションをソラに促すことでゼロショットで引き出すことができます。
このシミュレーション動画をテキスト入力のみで生成できるとは驚きです。
Soraのこの機能は、ビデオ モデルの継続的なスケーリングが、物理世界とデジタル世界、およびその中に住む物体、動物、人々の高機能シミュレーターの開発に向けた有望な道であることを示唆しています。
Open AI Soraの高品質な動画生成を実現している技術
ここからは、これまで紹介したようなSoraの機能を実現している技術について紹介します。
ここまで高性能なモデルはいったいどのような技術で成り立っているのでしょうか…?早速見ていきましょう!
ビジュアルデータのパッチ化
Soraでは、ビデオや画像をLLMのテキストトークンに似た小さなデータ単位であるビジュアルパッチの集合として表現します。
パッチは、視覚データのモデルを効果的に表現することが先行研究で示されており、さまざまな種類のビデオや画像で生成モデルをトレーニングするための非常にスケーラブルで効果的な表現です。

まず動画を低次元の潜在空間に圧縮し、次に表現を時空間パッチに分解することで、動画をパッチに変換します。
具体的な方法としては、以下の手順の通りです。
- 動画を構成する各画像を用意(動画は画像の集合体)
- 1をVisual Encoderに通すことで低次元に圧縮
- 2で圧縮されたデータを、上図右端の1次元ベクトルに平坦化(パッチ化)
要するに、「画像生成でいうところのVAE」のようなものでデータを圧縮し、それを1次元のベクトルに変換しているのです。そして、この1次元ベクトルを、LLMでいうところの「テキストトークン」として、学習時に扱うそうです。
このSoraのパッチ化では、Vision Transformer(画像をTransformerで扱う技術)やNaViT(Vision Transformerの改良版)の研究で提案された手法が踏襲されているそう。

この手法を用いることで、畳み込み処理を使用せず、Transformer(LLM)で画像処理を行えるようになりました。Soraではこの技術を、動画の処理に応用しているのです。
Video compression network
Video compression network(ビデオ圧縮ネットワーク)は、視覚データの次元を削減するネットワークで、生の動画を入力として受け取り、時間的および空間的に圧縮された潜在表現を出力します。
Soraは、この圧縮された潜在空間でトレーニングされ、その後、この圧縮された潜在空間内で動画を生成します。
Spacetime Latent Patches
Spacetime Latent Patches(時空潜在パッチ)は、圧縮された入力動画が与えられると、トランスフォーマートークンとして機能する一連の時空パッチを抽出します。
パッチベースの表現により、Sora はさまざまな解像度、長さ、アスペクト比のビデオや画像でトレーニングでき、推論時にランダムに初期化されたパッチを適切なサイズのグリッドに配置することで、生成されるビデオのサイズを制御できます。
ビデオ生成用のスケーリングトランスフォーマー
Sora はディフュージョンモデルであり、ノイズの多いパッチ (およびテキスト プロンプトなどの条件付け情報) が入力されると、元の「きれいな」パッチを予測するようにトレーニングされます。

拡散モデルには通常、以下のような「U-Net」と呼ばれる「画像のセマンティックセグメンテーション用モデル」が使用されます。

一方、SoraではU-Netではなく、Transformerを用いているのです。そうすることで、「画像を画像として処理するというアプローチ」から、「画像をテキストとして処理するアプローチ」に変換しているのでしょう。
以下が、Diffusion Transformerの概略図です。

このアーキテクチャを用いることで、テキストを生成するかのように、動画を生成しているのでしょう。
ここで重要なのは、Soraはディフュージョントランスフォーマーであるということです。これは言語モデリング・コンピュータビジョン・画像生成など、様々な領域で顕著なスケーリング特性を示しています。
OpenAIは、ディフュージョントランスフォーマーが動画生成モデルとしても効果的であることを発見しました。
以下の例で、トレーニングの計算量が増えるにつれて、サンプルの品質は著しく向上することが示されています。
【Base】
【16倍】
言語理解
Soraは、DALL·Eの研究で得た成果、特にDALL·E 3からのキャプション再生成技術を応用し、非常に説明的なキャプションモデルをトレーニングし、次にそれを使用してトレーニングセット内のすべての動画のテキストキャプションを生成しています。
高度に説明的なキャプションの訓練は、生成動画の全体的な品質だけでなく、テキストの忠実度を向上させることが分かっているためです。
また、GPTを活用して短いユーザープロンプトを長い詳細なキャプションに変換し、モデルに送信します。これにより、Soraはユーザーのプロンプトに正確に従った高品質の動画を生成可能です。
Training text-to-video generation systems requires a large amount of videos with corresponding text captions. We apply the re-captioning technique introduced in DALL·E 3 to videos. We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set. We find that training on highly descriptive video captions improves text fidelity as well as the overall quality of videos.
Similar to DALL·E 3, we also leverage GPT to turn short user prompts into longer detailed captions that are sent to the video model. This enables Sora to generate high quality videos that accurately follow user prompts. ※1
和訳:テキスト-ビデオ生成システムのトレーニングには、対応するテキスト・キャプションを持つ大量のビデオが必要である。我々は、DALL-E 3で導入されたリキャプション技術を動画に適用する。まず、高度に記述的なキャプションモデルを学習し、そのモデルを用いて、学習セット内のすべての動画に対してテキストキャプションを生成する。記述性の高い動画キャプションを学習することで、動画の全体的な品質だけでなく、テキストの忠実度も向上することが分かる。
また、DALL-E 3と同様に、GPTを活用して短いユーザープロンプトを長い詳細なキャプションに変換し、ビデオモデルに送信します。これにより、Soraはユーザーのプロンプトに正確に従った高品質のビデオを生成することができます。
具体的な手法は、以下の手順の通りです。
- ユーザーがテキストプロンプトを入力
- 1のテキストをLLMによって、より具体的な文章に変換
- 2のテキストを拡散モデルに送り込み、テキストに沿った画像を生成

こうすることで、ユーザーがDALL-E3に入力した「抽象的なプロンプト指示」を、より詳細なプロンプト指示文に変えられます。そのプロンプト情報をText Encoderを通して拡散モデルに送り込むことで、ユーザーの意図に沿った画像を生成できるのです。
こうすることで、ユーザーがDALL-E3に入力した「抽象的なプロンプト指示」を、より詳細なプロンプト指示文に変えられます。そのプロンプト情報をText Encoderを通して拡散モデルに送り込むことで、ユーザーの意図に沿った画像を生成できるのです。
このDALL-E3のキャプション技術を、Soraにも応用しています。
このキャプション技術については、以下のソニーのYouTube動画の6分30秒あたりから、詳しく解説されています。
こうすることで、高品質なテキストでキャプションされた動画のデータセットを得ることが可能です。機械学習においては、学習データの品質がモデルの精度を大きく左右するので、Soraの高品質な動画生成は、こうした工夫のたまものなのでしょう。
生成動画のラベリング
Soraでは正式リリースにあたって、Soraで生成した動画を識別するために以下2つの工夫がなされています。
- 不可視のC2PAメタデータによる出所の証明(DALL-E 3に準拠)
- ChatGPT Plusのみ、目に見える透かし・ウォーターマークの付与
ディープフェイクや盗作のリスクがある程度軽減されているといえるでしょう。
Soraの動画事例を知りたい方は、こちらの記事をご覧ください。

Open AI Soraを使用する際の注意点
大幅に強化されてついに登場したSoraですが、まだまだ解決できていない注意点・課題が3つあります。まずは、著作権周りから詳しくみていきましょう!
人の著作物はアップロード不可
Soraでは、動画生成の参考用や切り貼りする用の画像・動画がアップロードできます。ただし規約上、以下に該当する人の著作物はアップロードができません。
- 自分が著作権を有していない画像・動画
- (フリー素材でも)必要な権利を全て取得していない画像・動画
- 本人から書面によるアップロード許可を得ていない他人の画像・動画
Soraで動画生成をする際には、画像生成AIで用意したイラストや自分で撮影した写真&動画を使うとよいでしょう。
人物画像も当面アップロード不可
Soraについては十分な安全対策がなされていますが、それでもディープフェイクやポルノコンテンツの生成に悪用されるリスクが否定できません。
そのためSoraでは、リリース後から当面の間、人物画像・人物動画のアップロードが拒否されます。今後、ディープフェイク対策が整うにつれて、この制限は緩和されるようです。
複雑な動きの表現はまだ苦手
今回正式リリースされたSora(Sora Turbo)は、2月のプレビュー版と比べて、動画生成の能力が大幅UPしています。ただ、以下の課題については、今なお解決中とのことです。
- 物理的性質の表現のエラー(例:ガラスが割れる様子を表現しづらい)
- 複数の被写体が複雑に動く構図でのエラー(例:動く物体が動物や人に変形する)
今後、多くのユーザーがSoraを使うにつれて、エラーの解決に欠かせないフィードバックが集まってくるはず。Soraの成長を暖かく見守ってあげましょう!
Open AI Soraの料金プラン
Soraはリリース時点でChatGPTの一部有料プラン、ChatGPT Plus / ChatGPT Team / ChatGPT Proでのみ追加料金なしで使えます。(無料版ChatGPT / ChatGPT Enterprise / ChatGPT Edu / OpenAI APIでは利用不可) それぞれでの料金とSora周りの特典は、以下のとおりです。
ChatGPT Plus | ChatGPT Team | ChatGPT Pro | |
---|---|---|---|
月額料金 | 20ドル | 25ドル(年払い)/ 30ドル(月払い) | 200ドル |
動画生成用クレジットの割当数 | 1,000クレジット | 1,000クレジット | 10,000クレジット |
1ヶ月に生成できる最大の動画数 | 50本 | 50本 | 500本 |
一度に生成できる動画の長さ | 5秒 / 10秒 | 5秒 / 10秒 | 5秒 / 10秒 / 15秒 / 20秒 |
一度に生成できる動画の本数 | 1本 | 1本 | 4本 |
動画の最大解像度 | 480p / 720p | 480p / 720p | 480p / 720p / 1080p |
ウォーターマーク | あり | あり | なし |
レート制限 | あり | あり | なし |
その他特典 | ・OpenAI o1 / OpenAI o1-mini / ・GPT-4 Turboへのアクセス ・DALL-E 3での画像生成 ・無制限のファイルアップロード ・Advanced Data Analysisの使用 ・ChatGPT searchの使用 ・Advanced Voice Modeの使用 ・GPTsの作成 ・新機能への早期アクセス | ・Plusの特典 + ・ワークスペースでのGPT作成&共有 ・ワークスペースの管理 ・入力データのオプトアウト | ・Plusの特典 + ・「o1 Proモード」へのアクセス ・OpenAI o1とGPT-4oの利用回数制限の廃止 ・Advanced Voice Modeの利用回数制限の廃止 |
OpenAIによると今後(来年の上半期予定)、ChatGPTやSoraの利用料金はニーズに応じてカスタマイズできるようになっていくとのことです。Sora専用のリーズナブルな料金プランが出てくるかもしれませんね。
なお、ChatGPT Plusの料金について詳しく知りたい方は、以下の記事をご覧ください。

Open AI Soraは商用利用が可能!
Soraは、OpenAIの利用規約にさえ従っていれば、商用利用が可能です。OpenAIは、ChatGPTなどのツールそれぞれに対して共通の利用規約を適用しているので、Sora専用の利用規約はありません。
お客様とOpenAIの間において、適用法令で認められる範囲で、お客様は、(a)インプットの所有権限は保持し、(b)アウトプットについての権利を有するものとします。当社はアウトプットに関する権利、権原、及び利益がある場合、これらすべての権限をお客様に譲渡します。※2
引用:利用規約OpenAI
ただし、OpenAIのAIで生成したコンテンツは、今後のサービス改善のためにOpenAIに利用される可能性がある点には注意してください。
また、ChatGPTのPlusプランユーザーは、Soraで生成した動画にウォーターマークが入ってしまうので、商用利用するならウォーターマークの入らないProプランを契約する必要があります。
ChatGPTの商用利用や著作権問題について詳しく知りたい方は、以下の記事をご覧ください。

Soraの使い方
ここからは、正式リリース版Soraの使い方をスクリーンショット付きでご紹介します。まずは、Soraへのログイン手順から、みていきましょう!
ログイン
Soraへのログインは、Sora特設サイトから既存のChatGPT Plus / Team / Proアカウントを使って行えます。以下、その手順をみていきましょう!
Soraの特設サイトにアクセスすると、画面右上に「Log in」ボタンがあるはず。まずはそちらをクリックしてください。

するとメールアドレスの入力欄が現れます。
ここでは、ChatGPTで使っているメールアドレスの他、Googleアカウント / Microsoftアカウント / Appleアカウントでのログインも可能。今回はメールアドレスを入力して「続行」を押してみましょう!

メールアドレス入力後は、パスワードの入力画面が現れます。こちらもChatGPTのパスワードを入力して、「続ける」をクリックしてください。

一通り入力を終えるとログインが完了し、以下のとおりSoraのホーム画面が表示されるはずです。

プリセットの登録
Soraでは、プリセットを登録しておけます。プリセットを登録しておくことで、カメラの設定・色・照明・色調・テーマなどをあらかじめセットしておけるので、必要なときにすぐに切り替え可能です。
プリセットを登録する際は、まずプロンプトの入力画面下にある以下のマークをクリックしてください。
「Manage」を開くと、初期登録済みのプリセットの内容を確認したり、新しくプリセットを登録できたりします。
プリセットを登録して、動画生成の効率を高めましょう!
動画生成の方法
ここからは、Soraを使用した動画の生成方法を解説していきます。
今回は、以下の4パターンで動画を生成しました。
- テキストからの動画生成
- 生成した動画の編集
- 画像・動画からの動画生成
- Storyboard
それぞれの動画生成方法について詳しく解説していきます。
テキストからの動画生成
Soraの画面最下部にあるインターフェースからは、テキスト(英語のほか日本語もOK)での動画生成が可能。さらに、その下に並ぶボタンでは……
- 画像・動画のアップロード欄(+)
- 動画全体のトーン・エフェクト(Style presets)
- 生成する動画のアスペクト比
- 生成する動画の画質
- 生成する動画の長さ
- 一度に生成する動画のバリエーション数
- タイムラインでの動画編集(Storyboard)
- プロンプト送信(↑)
といったオプションも指定できちゃいます。
では早速、以下の条件をSoraに渡して、テキストからの動画生成を試してみましょう!
設定項目 | 詳細 |
---|---|
プロンプト | 白い猫がオレンジを割って立ち上がって出てきて、 腰を振って踊っている様子。 |
動画全体のトーン・エフェクト | Balloon World |
生成する動画のアスペクト比 | 1:1 |
生成する動画の画質 | 480p |
生成する動画の長さ | 5s |
一度に生成する動画のバリエーション数 | 1v |

「↑」ボタンあるいはEnterキーでプロンプトを送信した後、しばらく待つと……

このように動画が生成されます。Soraが生成してくれた実際の動画は以下のとおりです。
見事、Soraはかなりアクロバティックな猫の動画を生成してくれています。ただ、首がねじれていたり、指定したとおりの動きではなかったりとエラーも目立つようす。入力するプロンプトは英語のほうがいいのかもしれませんね。
生成した動画の編集
さて、先ほどSoraで生成した動画をクリックしてみると……

このように画面下部に編集のオプションが現れます。ここでそれぞれのオプションを選んでできることは……
- Edit prompt:プロンプトを変えて動画生成
- View story:動画のタイムラインを確認
- Re-cut:動画の一部を延長
- Remix:プロンプトで動画を再構築
- Blend:2つの動画から新たな動画を生成
- Loop:動画の一部からループ動画を作成
以上のとおりです。
それではまず、この動画を使って「Remix」の手順をみていきましょう。ということで、Remixをクリックしてください。

するとこのように、Remix用の設定画面が現れるはず。ここではプロンプトの入力のほか、一度に生成するバリエーション数・画質・Remixの度合いが選べます。
とりあえず今回は、Strong Remixを選んで「白猫黒猫2匹で踊る」というプロンプトをSoraに渡してみましょう!プロンプトを送信後、しばらく待つと、
先ほどの動画に黒猫が追加されました。
続いては、今Remixした動画と元の動画を「Blend」で混ぜて、新たに1つの動画を生成してみます。ではまず、混ぜたい動画をクリックしたあと、画面下部のBlendから「Choose from library」を選択しましょう!

すると以下のとおり、Blendに使う動画が選べます。今回はここから、一番始めに生成した猫の動画を選んでみましょう。

2個目の動画を選ぶと、以下のとおりBlendの操作画面に移ります。ここでは曲線の範囲をマウス操作で調整することで、Blendの比率が変更可。さらに、画面下部・左から3番目のボタンをクリックしてみると……

以下のとおりBlend比のテンプレートが選べます。

このテンプレートから「Sample」を選んでみると……

以上のとおり、自動でいい感じの曲線が設定されています。あとは「Blend」をクリックするだけで、
白猫黒猫の動画と白猫単体のダンス動画が混ざって、新しい動画になっていますね。
今度は、Blendした動画を「Loop」でループさせてみます。ループさせたい動画を選択して、画面下部からLoopを選ぶと……

このように編集画面が開きました。ここでは、ループさせる範囲が指定できるほか、ループ動画の長さがShort(2秒)/ Normal(4秒)/ Long(6秒)から選べます。諸々の設定を済ませたあと、「Loop」をクリックすると、
このように、ループ動画が完成しました。
最後に、今用意したループ動画について、「Re-cut」でお気に入りのシーンを延長してみます。任意の動画で画面下部のRe-cutをクリックすると……

このように、タイムライン上でRe-cutで延長する範囲が選べます。試しに動画を前後に縮めて……

画面右下「↑Create」をクリックしてみましょう!
するとこのように、お気に入りの箇所を前後に伸ばした動画が返ってきます。
ちなみに、SoraのRe-cutでは動画→テキストへの逆変換も可能。その処理は……

以上のとおり「Convert to text」から行えます。試しにクリックしてみると、

動画の内容を説明した英文のプロンプトが返ってきていますね。
画像・動画からの動画生成
今度は、画像・動画からの動画生成についても方法をお見せします。まずは、動画生成用インタフェースの左下「+」をクリックしてみてください!

すると、このように画像・動画のアップロードにあたっての規約が表示されます。各チェック項目の内容は、
- 本人の同意がない場合or18歳未満の人を含むメディアをアップロードしないことに同意する
- 暴力や露骨な表現を含むメディアをアップロードしないことに同意する
- アップロードするメディアに必要なすべての権利を有することに同意する
- アップロードしたメディアを悪用した場合、アカウントが払い戻しなしに停止or削除されることがあることに同意する
以上のとおりで、かなり厳しい感じです。それぞれ理解した上でチェックを入れて「Accept」をクリックしましょう!
規約に同意すると、動画生成用インタフェースの左下「+」から、画像・動画がアップロードできるようになります。今度は猫の写真(ライターが撮影したもの)をアップロードして、以下の条件をSoraに渡してみましょう。
設定項目 | 詳細 |
---|---|
プロンプト | 猫が宇宙へロケットのように飛び立つ |
動画全体のトーン・エフェクト | Stop Motion |
生成する動画のアスペクト比 | 16:9 |
生成する動画の画質 | 480p |
生成する動画の長さ | 5s |
一度に生成する動画のバリエーション数 | 1v |

プロンプトを送信すると……
このように、元の画像をベースにした動画が生成されます。動きはリアルですが、やはり日本語だと命令がうまく反映されないようですね。
Storyboard
Soraでは、動画生成用インタフェースの右下「Storyboard」から、タイムライン形式の動画生成&編集が行えます。試しにクリックしてみましょう!

するとこのように、動画を貼り付けるためのカードが表示されます。このカードからは……
- カード右下「+」(Add photo or video):Sora上の動画の選択 / 動画・画像のアップロード
- カード中央テキストボックス(Describe this scene or add an image or video):プロンプトの入力
- ゴミ箱:カードの削除
といったことが可能です。
それでは、試しに以下の設定をSoraに渡して、動画生成を行ってみます。
設定項目 | 詳細 |
---|---|
カード1の動画 | 最初にテキストから生成した動画 (白い猫がオレンジを割って立ち上がって出てきて、腰を振って踊っている様子。) |
カード2のプロンプト | Santa’s sleigh flies gracefully over the town, with reindeer leading the way, leaving a sparkling trail in the night sky. |
動画全体のトーン・エフェクト | Stop Motion |
生成する動画のアスペクト比 | 16:9 |
生成する動画の画質 | 480p |
生成する動画の長さ | 5s |
一度に生成する動画のバリエーション数 | 1v |

気になる結果のほどは……
こんな感じ!被写体が猫というよりはネズミだったり、爆走していなかったりとツッコミどころは満載ですが、それなりの動画が返ってきていますね。
Soraでクリスマス動画を作ってみた!
Soraの「Storyboard」は、使い方次第で凝った動画が作れます。今回は以下の設定をSoraに入力して、クリスマスにぴったりなショートムービーを作ってみました!
設定項目 | 詳細 |
---|---|
カード1のプロンプト(0秒〜) | On Christmas night, Santa Claus rides his sleigh across a snowy town under a starry sky. Santa, in his classic red outfit and white beard, carries a large sack of gifts. He smiles warmly as he delivers presents to children’s homes. His sleigh, pulled by reindeer, soars over houses glowing with cozy lights. The snow-covered rooftops and twinkling stars create a magical atmosphere, with Santa’s silhouette clearly visible against the night sky. |
カード2のプロンプト(2秒〜) | Santa’s sleigh flies gracefully over the town, with reindeer leading the way, leaving a sparkling trail in the night sky. |
カード3のプロンプト(4秒〜) | The final scene shows children waking up with joy and excitement as they discover the presents Santa left for them, surrounded by a warm, festive home environment. |
動画全体のトーン・エフェクト | None |
生成する動画のアスペクト比 | 16:9 |
生成する動画の画質 | 480p |
生成する動画の長さ | 5s |
一度に生成する動画のバリエーション数 | 2v |

Createをクリックすると……
まるでプロが編集したかのような動画が返ってきました。
やはり、プロンプトは英語で詳しく記述した方がよいようです。これなら、TikTokやYouYubeショート用の動画も簡単に作れちゃうかも。みなさんもぜひぜひ、お試しください!
OpenAI Soraが現状抱えている課題
OpenAIのSoraは、現状以下のような課題を抱えています。
- 物理法則の再現や因果関係の理解が難しい
- 日本語プロンプトの理解力が低い
以下では、現時点のSoraの課題を解説していくので、Soraを使う前にあらかじめ確認しておきましょう。
物理法則の再現や因果関係の理解が難しい
Soraのリリース前に実施した安全対策とリスク評価を概説した文書である「System Card」によると、現時点でSoraは物理法則の再現や因果関係の理解に乏しい一面があるとされています。
たとえば、物理法則を無視して非現実的な動きが表現されたり、クッキーをかじっても跡が残らないといった現象が起きているようです。
Soraを使用する際は、こういった問題点があることを事前に理解したうえで、動画生成後のチェックを徹底しましょう。
日本語プロンプトの理解力が低い
Soraは、英語で入力したプロンプトを正確に読み取る一方で、日本語のプロンプトを入力して動画を生成すると精度の低い動画が生成されることがあります。これはSoraに限らず、ほとんどの生成AIが同様の課題を抱えている状況です。
したがって、基本的には翻訳ツールなどを使って英語に翻訳したプロンプトを入力して、プロンプトの意図を汲み取った高精度な動画を生成してもらいましょう。
OpenAI Soraの導入事例
OpenAIのSoraは、すでに以下をはじめとしたいくつかの企業が導入しています。
- トイざらス
- Adobe Premiere Pro
現状、企業の広告動画制作や動画編集サービスの付加価値向上に役立てられているようです。
以下で、各企業の導入事例を詳しく解説していきます。
トイざらス
玩具量販店大手の米トイザらスは、OpenAI Soraを使って、約1分程度のWebコマーシャル動画を生成して公開しました。※3
動画内容は、トイザらス創業者のチャールズ・ラザラス氏の幼少期を実写化したものとなっており、同社のマスコットキャラクター「ジェフリー」と交流する内容になっています。
なお、動画制作には、動画制作会社の米Native Foreignも協力しているとのことです。
Adobe Premiere Pro
アドビ株式会社が提供している動画編集ソフト「Adobe Premiere Pro」には、Soraを含む4種類の動画生成AIが搭載されています。
- Adobe Firefly Video Model:Adobe自社開発の動画生成AI
+
- Sora:OpenAI製のサードパーティ動画生成AI
- RunwayML:Runway製のサードパーティ動画生成AI
- Pika:Pika製のサードパーティ動画生成AI
動画生成AIの実装によって、追加された機能は以下のとおりです。
- 動画の生成拡張
- 動画中オブジェクトの追加と削除
- Bロールショットの生成
- サードパーティー製動画生成AIの選択
とくに、尺が足りていない部分を埋められる動画の生成拡張が便利です。元の動画シーンに合わせて、最適な動画をAIが生成して繋ぎ合わせてくれます。
Adobe Premiere ProとSoraの連携について詳しく知りたい方は、以下の記事をご覧ください。

Soraは他のモデルとは一線を画す超高性能動画生成AIモデル!
Soraは、2024年2月15日に発表されて同年12月9日に正式リリースされたOpenAI社の動画生成AIモデルで、現実と見分けがつかないほどリアルで高精細な動画を生成してくれます。
最後に、そんなSoraの特徴をまとめます。
- テキストから動画への変換: Soraは、テキストプロンプトに応答して超高品質の動画を作成する能力を持っています。
- ビデオ生成用のスケーリングトランスフォーマー:Soraはディフュージョントランスフォーマーであり、これは動画生成モデルとしても有用で、トレーニングの計算量に応じて著しく性能が向上します。
- Text-To-Video以外の機能:Soraには、生成された動画の拡張、動画の編集、動画の接続、画像生成などのText-To-Video以外の機能も充実しています。
- 他のモデルの技術の応用:Soraは、DALL·E 3からのキャプション再生成技術を応用し、トレーニングセット内のすべての動画のテキストキャプションを生成します。また、GPTをGPTを活用して短いユーザープロンプトを長い詳細なキャプションに変換します。
OpenAI曰く、「Sora は、現実世界を理解してシミュレーションできるモデルの基盤にして、 AGI を達成するための重要なマイルストーンである」のこと。
このモデルが生成する動画や機能を見せられたら、私たちが想像しているよりも早くAGIが実現してしまうのではないかと期待してしまいますね!
最後に
いかがだったでしょうか?
動画生成AIを事業にどう活かせるか、具体的な活用方法や効果的な導入事例を元に専門家が最適なソリューションをご提案します。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。