【中国アリババ社のAIツールまとめ】GAFAMを超える中国企業の神生成AIツール10選

中国 アリババ AIツール GAFAM 生成AIツール

中国のアリババグループは、AIに力を入れている大手企業の1つです。

最近も「キャラクター生成ツールAnimate Anyone」や「仮想試着ツールOutfit Anyone」「ダンス動画生成ツールDreaMoving」などをリリースし、大きな話題を呼んでいました。

AI分野ではアメリカ企業が注目されがちですが、中国でもAI開発企業を積極的に後押しする流れができています。

今回は、そんなテクノロジー大国である中国の、アリババグループが開発した生成AIツールをまとめてご紹介します。

ChatGPTや、他の生成AIに負けないほどの能力を持ったAIも登場しますので、ぜひ最後までご覧ください。

目次

【Animate Anyone】キャラクター生成AI

Animate Anyoneは、静止画像からキャラクターアニメーションビデオを作成するAIツールです。

この生成AIは、写真のキャラクターがどんな風に見えるかをしっかりと覚えて、それを動画にします。

Animate Anyoneには、キャラクターがどう動くかを決める「ポーズガイダー」という機能があります。

その機能によって、キャラクターが自然に動くように見えるのです。

さらに、「テンポラルレイヤー」という機能が動きをスムーズにつなげてくれます。

この方法は、いろいろなキャラクターに使うことができ、作った動画は写真と同じように見えるし動きもちゃんとコントロールできます。

そのため、Animate Anyoneはこれからのアニメ作りにとって、とても役立つものになると期待されています。

参考記事:Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

実際の使用例

Animate Anyoneに導入されている4つの機能が組み合わさることで、静止画像から高品質な動画が生成できます。

  • 高品質なビデオ生成
  • 多様なキャラクターへの適用性
  • トレーニングプロセス
  • ベンチマークでの評価

フォトリアルな画像からイラストまで、どんな画像でも生き生きと動かすことができます。

Tiktokなどの動画配信の世界も大きく変わっていきそうですね。

なお、Animate Anyoneについて詳しく知りたい方はこちらの記事をご覧ください。
【Animate Anyone】一枚の画像だけで好きなアニメキャラや人を思い通りに動かせる最新AIの仕組みを解説

【Outfit Anyone】仮想試着ツール

Outfit Anyoneは、アリババグループのインテリジェントコンピューティング研究所によって開発された先進的な仮想試着ツールです。

このツールを使えば、自分の全身写真と気になっている服の画像をを用意するだけで、瞬時にオンラインでリアルな試着体験ができます。

また、新しいアニメーションキャラクターの作成などを行うことができるツールとなっています。

ショッピングの場面や、映像制作分野での応用が期待されているツールです。

実際の使用例

このツールは、ユーザーが実際に服を試着することなく、ファッションを体験できるようにする革新的なツールとなっています。

この技術はポーズや体型などの要素を調整することでスケーラビリティを実現し、写真からイラスト画像まで幅広い適用性を持っています。

また「Outfit Anyone」は、あらかじめ指定されたモデルに好きな服を着せることができ、さらに「Animate Anyone」と組み合わせることでアニメーションも作成できます。

ファッションの体験や、動画作成にも大きな影響を与えそうですね。

なお、Outfit Anyoneの使い方について詳しく知りたい方はこちらの記事をご覧ください。
【Outfit Anyone】「服を着る」という概念が大きく変わる!誰でも好きな服を着れる最新AIの使い方〜実践まで

【DreaMoving】ダンス動画生成AI

DreaMovingは、中国のアリババグループが2023年12月に発表したダンス動画生成AIです。

顔写真とポーズデータをアップロードし、プロンプトを入力することで自由自在にダンス動画を生成できます。

全身の画像は必要なく、顔のリファレンス画像とプロンプト+ポーズデータで構築するので、使い勝手も良さそうですね。

なお、現状はデモ動画のみが公開されており、コードやモデルは公開されていません。

デモ動画では、服装や背景をプロンプトで指定し、さまざまなダンスを踊っている動画が公開されています。

動画を生成するまでにかかった時間などは公表されていませんが、従来の方法でダンスのPVを1本撮るよりも早く生成できるのは間違いないでしょう。

参考記事:DreaMoving: A Human Video Generation Framework based on Diffusion Models

実際の使用例

基本的にDreaMovingは、顔写真とポーズデータをアップロードして使用することを想定していますが、プロンプトや顔写真単体でもダンス動画を生成できます。

DreaMovingでダンス動画を生成できるのは、以下の3パターンです。

  • 顔の画像+ポーズデータ+プロンプトでダンス動画を生成
  • プロンプト単体でもダンス動画を生成可能
  • 顔+服装など2つのデータをアップロードして動画を生成

AIで作られたとは思えないほどの高いクオリティが再現されていますね!

なお、DreaMovingの使い方について詳しく知りたい方はこちらの記事をご覧ください。
【DreaMoving】顔写真だけでTiktok動画を無限に作れるAIツールの仕組みを徹底解説

【 I2VGen-XL 】イメージ to ビデオ生成AI

I2VGen-XLは、アリババが発表した「画像から動画を生成できるイメージtoビデオAI」の新モデルです。

画像入力とプロンプトで指示することができ、テキスト記述を使用してビデオの内容を細かく制御できます

特徴としては、

  • オープンソースとしてリリース
  • 最大1280×720の解像度
  • 3500万のテキスト-ビデオペアで学習
  • 60億のテキスト-イメージペアで学習

と高性能を誇っており、まるで映画やゲームのような美しい世界を表現しています。

I2VGen-XLの新しい点は、静止画像からビデオへの生成過程を分離し、各段階で特化した処理を行うことです。

これにより「意味的な生合成」と「ビデオの質」の両方を、同時に向上させることが可能になります。

実際の使用例

I2VGen-XLが統合されるプラットフォームやアプリは不明ですが、様々なシーンでの活用が期待されています。

  • 製品紹介ビデオ
  • ブランドストーリーの展開
  • 不動産や物件などのリアルエステート

など、現実社会と組み合わせた様々な使い方が想定されます。

画像を動画にするだけでなくストーリー性も考慮してくれるようなので、上手に使いこなすことで応用の幅が広がりそうですね。

【通義千問(Tongyi Qianwen)】自然言語処理モデル

通義千問(Tongyi Qianwen)は、アリババグループの自然言語処理モデルです。

テキストの生成、翻訳、要約、質問への回答など、さまざまな言語処理タスクを実行できます。

2023年11月30日には、72Bパラメータを持つ最新モデル「Qwen-72B」を公開しました。

このモデルは、Llama2 70Bの性能を大幅に上回り、オープンソースモデルでありながら多くのベンチマークであのGPT-3.5を上回るスコアを獲得しています。

通義千問は、さまざまな業界や用途で活用されていますが、特にEコマースやマーケティング・教育などの分野で、商品の説明やレビュー・広告の作成などでの活用が多い印象です。

実際の使用例

Qwen-72Bは通義千問の性能をさらに向上させたモデルであり、より複雑なタスクや創造的なタスクにも対応できます。

例えばQwen-72Bは、画像や音声などのデータセットも利用することで、画像の生成や音声の生成、創造的なコンテンツの生成などのタスクを実行します。

特徴は以下のとおり。

  • トレーニングとデータ: Qwen-72Bは中国語、英語、多言語テキスト、コード、数学など、一般分野から専門分野までを含む 3兆トークンという巨大なデータセットでトレーニングされています。
  • パフォーマンス: 代表的なLLMであるGPT-3.5より多くのタスクで優れた性能を発揮し、LLaMA2-70Bに対しては評価したすべてのタスクでその性能を上回っています。
  • 汎用性: 大きなサイズと複雑さにも関わらず、Qwen-72Bは低コストでモデルを利用できます。その量子化バージョンにより、最小限のメモリ使用(3GB未満)で運用できるため、家庭用PCでも実装でき、様々なアプリケーションで利用できます​
  • より長いコンテキストのサポート: Qwen-72Bは32kのコンテキスト長をサポートしています。

なお、Qwen-72Bについて詳しく知りたい方はこちらの記事をご覧ください。
【Qwen-72B】Llama 2、GPT3.5を大幅に上回る性能のアリババLLMを実際に使ってレビューしてみた

【通義万相】画像生成AI

通義万相は、アリババグループから公開された画像生成モデルです。

テキストによる指示を入力すると、水彩画、油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D漫画などリアルで創造的な画像を生成できます。

通義万相は、画像生成AIの新たな可能性を示すモデルとして、さまざまな業界や用途で活用されることが期待されています。

  • テキストによる指示で、さまざまな画像を生成できる
  • 高解像度で、創造性の高い画像を生成する
  • 空間レイアウトやパレットなどの最終的な画像の生成を細かく制御できる

など、今後のさらなる進化が期待されています。

実際の使用例

通義万相の具体的な応用例としては、以下のようなものが挙げられます。

  • Eコマース:商品の画像や広告の作成、顧客の視覚体験を向上させる
  • マーケティング:キャンペーンやコンテンツの作成、ターゲティングの精度向上
  • 教育:教材やイラストの作成、創造性の育成
  • エンターテインメント:映画やアニメの制作、新たな表現方法の創造

ビジネス、教育、エンターテインメントなど、実生活においても幅広い分野で活用されそうですね。

【通義仁心】医療AIモデル

通義仁心(Tongyi Renxin)はアリババグループによって開発されたAI技術で、特に医療分野での応用に焦点を当てています。

この技術は、医療データの分析や診断支援を目的としており、医師の判断を補助するための情報提供を行います。

  • 膨大な量の医療データでトレーニングされており、高い精度で医療タスクを実行できる
  • テキストや画像、音声などのさまざまなデータ形式を処理できる
  • 自然言語処理や機械学習などの技術を活用することで、複雑な判断や推論を行うことができる

などの特徴を有しており、医療サービスの質を向上させると共に、効率化を促進するためのツールとして期待されています。

実際の使用例

通義仁心は、さまざまな医療タスクをサポートします。

例えば、以下のような用途が期待されています。

  • 医療文書の解析:医療文書の中から、必要な情報を効率的に抽出する
  • 診断支援:医療画像や検査結果などのデータを分析し、診断の精度を向上させる
  • 治療アドバイス:患者の状態や治療の進捗状況を把握し、適切な治療方法をアドバイスする

このような情報を共有することで、医療AIソリューションを提供することにもつながります。

このように通義仁心は、医療の質の向上や効率化に貢献する可能性を秘めたモデルです。

通義仁心は、まだ開発途上ですが、今後さらに高度な医療AIモデルへと進化していくことが期待されています。

【通義点金】金融AIモデル

通義点金(Tongyi Dianjin)は、アリババが開発した金融AIモデルです。

財務データの分析、投資のアドバイス、リスク管理など、さまざまな金融タスクをサポートします。

通義点金は、膨大な量の金融データでトレーニングされており、テキストや画像、音声などのさまざまなデータ形式を処理できます。

また、自然言語処理や機械学習などの技術を活用することで、金融に関する複雑な判断や推論を行うことができます。

通義点金の具体的な特徴は、以下のとおりです。

  • 膨大な量の金融データでトレーニングされており、高い精度で金融タスクを実行できる
  • テキストや画像、音声などのさまざまなデータ形式を処理できる
  • 自然言語処理や機械学習などの技術を活用することで、複雑な判断や推論を行うことができる

専門的な知識が必要な金融業界において、大きな活躍が期待されています。

実際の使用例

通義点金の活用事例としては、以下のようなものが挙げられます。

  • 財務データの分析:財務データから、企業の財務状況や経営状況を分析できる
  • 投資のアドバイス:市場状況や企業の業績などを分析し、投資のタイミングや銘柄をアドバイスする
  • リスク管理:市場のリスクを分析し、リスクを回避するための対策を講じる

通義点金は、金融の効率化やリスク管理に貢献する可能性を秘めたモデルです。

今後、さらなる開発・改良が進められることで、さらに幅広い用途で活用されることが期待されています。

研究が進み実用性を広げられれば、金融の世界も大きく変えてしまいそうですね。

【通義暁蜜(Tongyi Xiaomi)】カスタマーサービスAIモデル

「通義暁蜜(Tongyi Xiaomi)」は、アリババ社が開発したカスタマーサービスAIモデルです。

カスタマーサービスのシナリオに特化して設計されたモデルで、顧客の意図を推論しながら適切な応答を提供します。

自然言語の理解や分析、推論の能力を有しており、音声の認識、翻訳、要約、質問への回答など、さまざまな音声処理タスクを実行できます。

通義暁蜜の具体的な特徴は、以下のとおりです。

  • 膨大な量の音声データでトレーニングされており、高い精度で音声処理タスクを実行できる
  • 音声の意味を理解し、新たな音声を生成できる
  • 複雑な文脈を理解したり、創造的な音声を生成できる

通義暁蜜は、膨大な量の音声データでトレーニングされており、音声の意味を理解して生成できます。

また、自然言語処理や機械学習などの技術を活用することで、複雑な文脈を理解したり創造的な音声を生成することを得意としています。

実際の使用例

通義暁蜜のできることとしては、以下のようなものが挙げられます。

  • 音声認識:音声をテキストに変換できる
  • 音声翻訳:音声を翻訳できる
  • 音声要約:音声を要約できる
  • 音声質問への回答:質問に対して、音声で回答できる

通義暁蜜は、さまざまな業界や用途で活用されることが期待されています。

例えば、Eコマースでは、顧客の音声による注文や問い合わせの対応に利用されています。

マーケティングでは、効果的な音声コンテンツの作成に利用されています。教育では、学習支援や教材の作成に利用されています。

具体的な活用事例としては、以下のようなものが挙げられます。

  • 顧客音声による注文や問い合わせの対応
  • 顧客ニーズを理解し、迅速かつ正確に対応する
  • 効果的な音声コンテンツの作成

カスタマーサポートを全てAIが行う、そんな未来も遠くないかもしれませんね。

【通義法睿(Tongyi Farui)】法律AIモデル

「通義法睿(Tongyi Farui)」は、アリババグループによって作られた法律AIモデルです。

法律専門家の業務効率向上をサポートするためにデザインされています。

「通義法睿(Tongyi Farui)」は、法的調査や法的関連の問い合わせへの回答、訴訟ケースの分析、法的文書の起草などのタスクを遂行します。

特徴は以下のとおりです。

・法律文書と判例の理解と分析に特化したAI
・自然言語処理と法解釈学習を通じた知識構築
・法廷判断の予測と法務処理の自動化が主目的

難しい判断や解釈が求められる法律の世界において、サポートしてくれるAIの存在は重要なものになっていきそうですね。

実際の使用例

通義法睿の使用例は、以下のとおりです。

  • 法律文書の要約自動生成
  • 裁判記録や判例文から重要ポイントを抽出し要約作成
  • 判断結果や量刑期間の予測
  • 裁判での判決予測に利用し判断材料を弁護士に提供
  • 法律相談への自動応答
  • 契約関連文書の精査
  • 契約条項の確認、解説作成、修正案提示など契約支援

専門知識や深い情報が必要な分野でも、AIの活躍する機会が増えていきそうです。

参考記事:アリババクラウド、さまざまな業界に特化した複数の生成AIモデルを発表

まとめ

本記事で紹介したアリババグループの生成AIツールは以下のとおりです。

  1. 【Animate Anyone】キャラクター生成AI
  2. 【Outfit Anyone】仮想試着ツール
  3. 【DreaMoving】ダンス動画生成AI
  4. 【 I2VGen-XL 】イメージ to ビデオ生成AI
  5. 【通義千問(Tongyi Qianwen)】自然言語処理モデル
  6. 【通義万相】画像生成AI
  7. 【通義仁心】医療AIモデル
  8. 【通義点金】金融AIモデル
  9. 【通義暁蜜(Tongyi Xiaomi)】カスタマーサービスAIモデル
  10. 【通義法睿(Tongyi Farui)】法律AIモデル

世界中で様々な生成AIがリリースされていますが、アリババのAIは精度も高く幅広い応用が期待されています。

興味を持ったAIがあれば、ぜひ使ってみてください。

弊社では法人向け生成AI研修・勉強会を行なっています

いかがだったでしょうか?

弊社では、法人様向けに生成AI研修を行なっております。
また、研修に加えて本事業の支援も行わせていただいております。

詳しくはこちらをご覧ください!
セミナー実績 | WEEL

研修をさせていただいた企業様からは、以下のような好評をいただいております。

生成AIについて包括的に理解ができ、多くの業務で生成AIが活用されるようになった。
生成AIの事例を知ることで、社内で生成AIを活用するためのアイデアがたくさん出てくるようになった。
全社で生成AIに関する認識を共有できたので、生成AIに関するプロジェクトの理解が得られるようになった。

研修の内容としては、以下のようなものになっています。

1. 生成AIの概要
2. 生成AIの歴史
3. 生成AIのリスク・対応策
4. 生成AIの活用事例
5. 生成AIの未来予測
6. 〇〇業界特有の生成AI活用法(様々な業界に対応)
7. プロンプトエンジニアリング実践(ChatGPTや画像生成AIへの入力文)
8. AI開発実践(Pythonプログラミング)
9. 生成AIの社内導入手順

※企業様のニーズに合わせて内容はカスタマイズしています。

「社員に生成AIに関する知識を身に付けてもらいたい」
「今後、生成AIを活用して事業展開をしていきたい」

と考えている方は、まずはご相談から承っておりますので、ぜひご連絡ください。

➡︎生成AIセミナー・社内勉強会について相談をしてみる

生成AIを社内で活用していきたい方へ
メルマガ登録

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • Hiromi Sai

    ChatGPTメディア運営 / テクニカルライター リベラルアーツ専攻。大学休学中は、Webマーケティング会社のマネージャーとしてライター、ディレクター100名のマネジメントをする。南米のチリとタイでの長期居住歴を持つ。

  • URLをコピーしました!
  • URLをコピーしました!
目次