CogVideoX、AI動画生成を革新する新技術発表

CogVideoX AI動画生成 50億パラメータ 高品質

清華大学とZhipu AIの研究者たちは、オープンソースのテキストから動画を生成するモデル「CogVideoX」を発表しました。

このモデルは、スタートアップ企業が支配するAI分野に新たな風を吹き込み、開発者に高度な動画生成能力を提供します。

このNEWSをAIが簡単要約
  • CogVideoXがAI動画生成に新風を吹き込む
  • 50億パラメータで高品質動画生成
  • 技術利用にはリスクと責任が伴う

CogVideoXは、テキストプロンプトから最大6秒の高品質な動画を生成し、既存の競合モデルを上回る性能を示しています。

このプロジェクトの中心である「CogVideoX-5B」は、50億のパラメータを持ち、720×480の解像度で毎秒8フレームの動画を生成。

特筆すべきは、そのオープンソースの特性であり、技術の民主化を促進しています。

研究者たちは、3D変分オートエンコーダ(VAE)を用いて動画を効率的に圧縮し、テキストと動画の整合性を高めるために「エキスパートトランスフォーマー」を開発しました。

この技術革新は、広告やエンターテインメント、教育、科学的可視化などの分野で新たな創造と革新の波を引き起こす可能性があるでしょう。

しかし、強力な技術の広範な利用にはリスクも伴い、ディープフェイクや誤情報の生成といった問題も懸念されています。

研究者たちは、技術の責任ある使用を呼びかけています。

参考記事:VentureBeat

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次