【Kling(クリング)】中国で誕生した動画生成AIの性能を解説!実際に生成した動画も紹介
WEELメディア事業部AIライターの2scです。
みなさん!お隣中国から、OpenAIのSoraを超えるかもしれない「最強の動画生成AI」が登場しています。
その動画生成AIはSoraと同じクオリティの動画を、なんとSoraの2倍の長さまで生成可能。気になる名前は……「KLING」です!
ということで当記事では、中国発の最強動画生成AI・KLINGを徹底解剖!技術面や機能面、デモンストレーション動画の注目ポイントまで、公式サイトよりも詳しくお伝えしていきます。
完読いただくと、次に来る生成AI関連技術のトレンドがわかる……かも。ぜひ、最後までお読みくださいね。
中国発の動画生成AI「KLING」の概要
「KLING」は、中国の動画共有SNS「快手 / Kuaishou」が開発した動画生成AIです。(※1、2)
そのすごいところは……
● 最新技術「拡散トランスフォーマー」と「3D Space-Time Attention System」を搭載
● Soraと同クオリティ(1080p、30fps)の動画が生成可能
● 一度に生成できる動画の長さはSoraの2倍で、最長2分まで
● 複雑な動きや物理法則を破綻なく表現可能
● フィクション題材の表現力も優秀
以上のとおり。このKLINGはなんと、OpenAIの動画生成AI・Soraを超えるスペックをもつ「現状最強の動画生成AI」なんです!
KLINGに採用されている技術
中国発の最強動画生成AI・KLINGは、フィクション題材をもリアルに破綻なく表現できてしまいます。その秘訣は、KLINGに盛り込まれた……
- 拡散トランスフォーマー:フィクション題材での表現力を高める技術
- 3D Space-Time Attention System:物理法則の表現力・リアリティを高める技術
以上2点の最新技術にあります。まずはOpenAI・Soraにも採用されている「拡散トランスフォーマー」から、そのしくみ・機能をみていきましょう!
拡散トランスフォーマー
KLINGは、Soraにも採用された「拡散トランスフォーマー」を搭載。(※1)これがどのような技術か、というと……
拡散モデル:動画をノイズで塗りつぶす工程を学習、逆の工程でノイズから動画を生成可
(→フィクション・抽象概念も、柔軟に表現できる)
+
Transformer:動画全体の流れを並列処理で学習でき、動画中の各要素とその前後関係の抽出が可能
(→文章を読むように、動画全体の流れが破綻なく理解・表現できる)
StableDiffusionのブレイン「拡散モデル」とChatGPTのブレイン「Transformer」を組み合わせたものになります。この拡散トランスフォーマーを搭載したKLINGでは、フィクション・抽象概念を含む動画の生成が破綻なく可能です。
3D Space-Time Attention System
KLINGには「3D Space-Time Attention System」という技術も採用されています。(※1)こちらは名前のとおり、「3D Space=3次元空間での動き」と「Time=時間経過」の関係性を学習するためのモデル。(※3)しくみとしては……
このように動画を細かなパッチに分けてから、一連の動きと時間の関係性を学ぶものになっています。
なお、拡散トランスフォーマー登場以前の動画生成AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
KLINGにできること
Soraと同じ技術を採用した動画生成AI・KLINGでは……
- 高解像度な2分動画の生成
- 複雑な動きの表現
- 3次元空間の理解
- フィクション題材での表現力
- ダンスムービーの生成
といったことが可能です。まずはSoraを超える「高解像度な2分動画の生成」から、詳しくみていきましょう!
高解像度な2分動画の生成
KLINGは解像度1080p(フルHD)でフレーム数30fpsの高品質な動画を、なんと最大2分まで生成できます。あのSoraでも、同じ品質の動画を1分までしか生成できません。つまりKLINGは、Soraの2倍優れた「現状最強の動画生成AI」というわけです。
複雑な動きの表現
Soraでは複数の物体の動きを表現する際に、しばしば破綻が生じていました。例えば、以下の子犬たちがじゃれ合う動画の場合……
このように子犬が分身してしまいます。
対してKLINGでは、複雑な動画および物理法則の表現が可能とのこと。具体的には……
- 季節が変わりゆくなかで、自転車に乗り続ける少年
- ナイフで玉ねぎを切る様子
といった動画が生成できるようになっています。
3次元空間の理解
KLINGでは先ほどの「3D Space-Time Attention System」によって、3次元空間への理解力・表現のリアリティが強化されています。実際、KLINGの動画(左)とSoraの動画(右)を見比べてみると……
このように違いは一目瞭然!ジュースをグラスから貫通させてしまったSoraに対して、KLINGはグラスの中でコーヒーと牛乳が対流している様子を破綻なく表現できています。
フィクション題材での表現力
Sora同様「拡散トランスフォーマー」を搭載しているKLINGは、フィクション題材に対する表現力にも優れています。例えば……
このように「ギターを弾くパンダ」「車を運転する白猫」といった、現実ではあり得ない光景も破綻なく表現できちゃうんです。生成AIだけで映画が撮れる日も、そう遠くはなさそうですね……
ダンスムービーの生成
KLINGは、独自の3Dモデリング&リギング技術によって「写真からのダンスムービー生成」を可能としています。(※2)その実力のほどは……
以上のとおり。フォトリアルなアイドルやアニメ風の美少女はもちろん、なんと兵馬俑まで衣装の破綻なくヌルヌル踊らせられちゃうんです。
なお、「拡散トランスフォーマー」をKLING・Sora同様に搭載した画像生成AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
KLINGの使い方・料金体系は?
KLINGは、2024年6月時点でリリースされておらず、事前登録受付中の段階にあります。そのため使い方・料金は明らかになっていません。
そしてKLINGの事前登録には、アプリ版「快影」のダウンロードと中国の電話番号が必要。日本版KLINGのリリースについては、続報を待つほかなさそうです。
KLINGで生成した動画を紹介
ここからはKLINGで生成した動画を計8本紹介!その表現力のすごさ・注目ポイントも含めて、お伝えしていきます。
動画1.自転車に乗る子供(長尺動画)
まずは「Sora超え」の事例、KLINGによる90秒の動画をご紹介します。それが以下「季節が変わりゆくなかで、自転車に乗り続ける少年」の動画です。
こちらは90秒のAI動画、という点だけでもすごいのですが……
- 秋→冬→春→夏と、季節の順番を破綻なく表現できている
- ペダルを動かす足の動きがなめらか
- 画面が揺れても、石畳の模様が安定している
- 風を受けて膨らむシャツの表現もリアルに忠実
というふうに、クオリティも圧倒的。生身のクリエイター顔負けの動画ができてしまっています。
動画2.岩礁を漂う熱帯魚
続いては、KLINGによる超リアルな動画をみていきます。KLINGに下記のプロンプトを入力すると……
An emperor angelfish with yellow and blue stripes swims in a rocky underwater habitat
お見事!熱帯魚の動画が返ってきました。この動画の注目ポイントは……
- プロンプトの「 emperor angelfish=タテジマキンチャクダイ」が忠実に再現できている
- 体の左右で模様が同じ
- 水中でのヒレの動きがリアル
以上のとおり。「ダイバーが撮影した動画」と言われても気づかないほどにリアルな仕上がりです。
動画3.コーヒーにミルクを注ぐ様子
今度は、先ほどチラ見せした事例です。下記のプロンプトをKLINGに入力し、「コーヒーにミルクを注ぐ様子」を生成させてみると……
A hand pours milk from a steel whisk into a cup of coffee on a table with a blurred kitchen background
このように、シズル感のある動画が生成されます!ポイントは……
- ガラスからコーヒーが貫通していない
- ミルクとコーヒーの対流がリアルに表現できている
- ピッチャー表面の旋盤仕上げの質感がリアル
- ピッチャーに手や机が反射する様子もリアル
以上のとおりで、KLINGだけで食品のCMが撮れちゃいそうです。
動画4.開花のスローモーション
KLINGなら、理科教材のような動画も生成できます。下記のとおり「開花のスローモーション動画」をKLINGにオーダーしてみると……
Two flowers bloom slowly against a black background, showing delicate petals and stamens
いい感じの動画が生成されました。
こちらのみどころは……
- 雄しべと雌しべの位置関係に破綻がない
- 花びらの質感もリアル
以上2点で、おおむね本物の花を撮った動画と遜色がありません。ただし「花のがくの部分からつぼみが出ている」という描写には違和感があります。ここは要改善ですね。
動画5.ギターで弾き語りするパンダ
先ほどお見せした「パンダの弾き語り動画」は、下記のプロンプトから生成可能です。
A giant panda plays a guitar by a lake
このキュートな動画は、KLINGの真骨頂ともいえる事例で……
- パンダが本来とらない行動を違和感なく表現できている
- 背景の水面のゆらぎがリアル
- アコースティックギターの弦数も現実同様6本になっている
というふうに、どこまでもリアルにフィクションが表現できています。
動画6.高速道路を走る車のサイドミラー
次は、KLINGの3次元空間への理解力がわかる事例を紹介します!下記のプロンプトを入力し、「走行中の車のサイドミラー」を表現させてみると……
In the evening, a car drives down the road, and the gorgeous sunset and serene scenery are reflected in the rearview mirror
お見事です!「鏡の中と外の位置関係」や「鏡の中のスピード感」が違和感なく表現できています。
強いて残念な点を挙げるなら、「鏡の外にない道路照明が鏡に映り込んでいる」という点でしょうか。それでも、一見しただけではリアルとの見分けがつきません。
動画7.青いコンゴウインコ
まだまだ、KLINGの実力を示す事例があります!今度は「青いコンゴウインコ」について、下記プロンプトからKLINGに生成させてみると……
In a close-up, the feathers of a bright blue parrot glisten in the light, revealing its unique plumage and vibrant colors
相変わらずのハイクオリティ!「羽やくちばしの質感」や「首の動き」を忠実に再現した動画が返ってきました。「左右で顔の模様が違う」という点に目をつむると、おおむね実写と同じ仕上がりになっています。
動画8.カフェで新聞を読むウサギ
最後に下記のプロンプトをKLINGに入力して、「カフェで新聞を読むウサギ」の動画を生成してもらいます。
A bespectacled white rabbit sits on a café chair reading a newspaper with a cup of hot coffee on the table
すると見事に、キュートな動画が生成されます。こちらのすごいところは……
- メガネ越しに見えるうさぎの目が破綻していない
- 湯気の動きもリアル
以上のとおりで、やはりフィクション題材であってもリアリティが保たれています。
なお、ライバルのSoraが生成した動画について詳しく知りたい方は、下記の記事を合わせてご確認ください。
中国発の動画生成AI「KLING」はSora超えかも……
当記事では、Soraを超えるかもしれない中国発の動画生成AI「KLING」について紹介しました。以下にてもう一度、KLINGのすごいところを振り返っていきましょう!
● 最新技術「拡散トランスフォーマー」と「3D Space-Time Attention System」を搭載
● Soraと同クオリティ(1080p、30fps)の動画が生成可能
● 一度に生成できる動画の長さはSoraの2倍で、最長2分まで
● 複雑な動きや物理法則を破綻なく表現可能
● フィクション題材の表現力も優秀
以上の強みをもつKLINGなら、「カフェで新聞を読むウサギ」「ギターを弾くパンダ」「車を運転する白猫」といったフィクション題材についても動画生成が可能。それでいて、物体の質感や物理法則をリアルに表現してくれます。
日本でのリリースは未定ですが、ぜひとも続報を待ちたいところです。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
WEELの生成AIへのスタンス
ChatGPTやStable Diffusionなど使い勝手の良いAIサービスは沢山あります。そういったもの1度使ってみて、もっとこうしたい、こう言った使い方をしたいと言った方に向けてカスタマイズを勧めております。
もし、自社で生成AIを活用したいという場合は
1. 汎用的な生成AIツールを導入し、定着させる
2. 業務を生成AIに解けるタスクまで分解し、自動化する
のどちらかが良いと思います。
弊社では
1の場合、生成AIセミナーの実施や生成AIコンサルティングなどで、AI専門家による生成AI活用指導
2の場合、PoC開発やソリューション開発などで、LLMエンジニアやAIコンサルタントが御社にあったAIツールの開発を行います。
無料相談にてご相談を承っておりますので、興味がある方は以下からご連絡ください。
→無料相談で話してみる
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。