OpenAIを超えた！？中国アリババの最強生成AIツール10選を解説

AIツール

2025-05-22

中国のアリババグループは、AIに力を入れている大手企業の1つです。

最近も「キャラクター生成ツールAnimate Anyone」や「仮想試着ツールOutfit Anyone」「ダンス動画生成ツールDreaMoving」などをリリースし、大きな話題を呼んでいました。

AI分野ではアメリカ企業が注目されがちですが、中国でもAI開発企業を積極的に後押しする流れができています。

今回は、そんなテクノロジー大国である中国の、アリババグループが開発した生成AIツールをまとめてご紹介します。

OpenAIのChatGPTや、他の生成AIに負けないほどの能力を持ったAIも登場しますので、ぜひ最後までご覧ください。

アリババグループの「Alibaba Cloud」とは？

Alibaba Cloud（アリババクラウド）は、中国のアリババグループが提供するパブリッククラウドサービスです。2009年に設立され、現在では中国国内で最大のクラウドプロバイダーであり、世界的にも第3位の規模を誇ります。

特に、生成AI分野においてAlibaba Cloudは急速に進化しており、さまざまなビジネスニーズに応えるための強力なツールを開発しています。次々に最新モデルを開発できる、アリババグループの強力なバックボーンも特徴です。

Alibaba Cloudが2025年4月29日に発表した基盤モデルの最新版「Qwen3」では、競合他社を抜く高い性能だけでなく、日本語を含む119言語に対応するなどグローバルな展開も進んでいます。

ここからはさっそく、アリババグループ「Alibaba Cloud」が開発した生成AIを10個ご紹介します！

【Animate Anyone】キャラクター生成AI

参考：https://humanaigc.github.io/animate-anyone/

Animate Anyoneは、静止画像からキャラクターアニメーションビデオを作成するAIツールです。

この生成AIは、写真のキャラクターがどんな風に見えるかをしっかりと覚えて、それを動画にします。

動画生成に大革命！

なんと画像１枚と「動き」を用意するだけで一切破綻のない動画にしてくれる新技術が出てきました。Animate Anyoneというもの。

見てもらえれば分かる通り革命です。
来年はもうAIが踊っているのか人間が踊っているのか分からない時代になります。 pic.twitter.com/nhIaO0TB80
— さとり (@satori_sz9) November 30, 2023

Animate Anyoneには、キャラクターがどう動くかを決める「ポーズガイダー」という機能があります。※1

その機能によって、キャラクターが自然に動くように見えるのです。

さらに、「テンポラルレイヤー」という機能が動きをスムーズにつなげてくれます。

この方法は、いろいろなキャラクターに使うことができ、作った動画は写真と同じように見えるし動きもちゃんとコントロールできます。

そのため、Animate Anyoneはこれからのアニメ作りにとって、とても役立つものになると期待されています。

実際の使用例

Animate Anyoneに導入されている4つの機能が組み合わさることで、静止画像から高品質な動画が生成できます。

高品質なビデオ生成
多様なキャラクターへの適用性
トレーニングプロセス
ベンチマークでの評価

【解説】驚きのアニメーション体験「Animate Anyone」とは？

AnimateAnyoneが大反響の一方、なかなかコードが公開されない

公式は「デモとソースコードへのアクセス提供の意図は揺るぎない」とコメント

もしかするとTikTokerの価値が変わるかもしれない

そんなAnimateAnyoneを解説>> pic.twitter.com/eDuBNMZmgZ
— 木内翔大＠SHIFT AI代表「日本をAI先進国に」𝕏 (@shota7180) December 5, 2023

フォトリアルな画像からイラストまで、どんな画像でも生き生きと動かすことができます。

Tiktokなどの動画配信の世界も大きく変わっていきそうですね。

なお、Animate Anyoneについて詳しく知りたい方はこちらの記事をご覧ください。

WEEL

【Animate Anyone】アニメキャラを自由に動かせるアリババAIの使い方や導入方法を解説 | WEEL 2023年11月に論文発表されたAnimate Anyoneの概要や仕組み、そして特徴について紹介します。Animate Anyoneは、静止画像からビデオを生成できます。Animate Anyoneを使いた…

【Outfit Anyone】仮想試着ツール

参考：https://humanaigc.github.io/outfit-anyone/

Outfit Anyoneは、アリババグループのインテリジェントコンピューティング研究所によって開発された先進的な仮想試着ツールです。

【アニメにも対応できる着せ替え生成AI】

「Outfit Anyone」は人間の写真と、服の切り抜き写真があれば写真のポージングに合わせて仮想試着が簡単に。服が正面からの写真しか無くても、試着時に補正してくれます。AnimateAnyoneと同じくアリババから発表!

続く>>#生成AI #AI #ファッション pic.twitter.com/n2T342Na9a
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 13, 2023

このツールを使えば、自分の全身写真と気になっている服の画像をを用意するだけで、瞬時にオンラインでリアルな試着体験ができます。

また、新しいアニメーションキャラクターの作成などを行うことができるツールとなっています。

ショッピングの場面や、映像制作分野での応用が期待されているツールです。

実際の使用例

このツールは、ユーザーが実際に服を試着することなく、ファッションを体験できるようにする革新的なツールとなっています。

この技術はポーズや体型などの要素を調整することでスケーラビリティを実現し、写真からイラスト画像まで幅広い適用性を持っています。

また「Outfit Anyone」は、あらかじめ指定されたモデルに好きな服を着せることができ、さらに「Animate Anyone」と組み合わせることでアニメーションも作成できます。

バーチャル試着のための「OutfitAnyone」と、静止画に動きをつけられる「AnimateAnyone」を組み合わせたデモ。

まさに動画にあるように二次創作的な用途や、ファッションECのバーチャル試着の用途で有用性かなり高そう。 pic.twitter.com/zNMiXXhV1m
— KAJI | 梶谷健人 (@kajikent) December 15, 2023

ファッションの体験や、動画作成にも大きな影響を与えそうですね。

なお、Outfit Anyoneの使い方について詳しく知りたい方はこちらの記事をご覧ください。

WEEL

【Outfit Anyone】「服を着る」という概念が大きく変わる！誰でも好きな服を着れる最新AIの使い方〜実践ま… Outfit Anyoneの概要や使ってみた感想をお伝えします。Outfit Anyoneは、オンラインで試着体験ができる画期的なAIツールです。オンラインで気軽に試着したい方におすすめの…

【DreaMoving】ダンス動画生成AI

参考：https://dreamoving.github.io/dreamoving/

DreaMovingは、中国のアリババグループが2023年12月に発表したダンス動画生成AIです。

顔写真とポーズデータをアップロードし、プロンプトを入力することで自由自在にダンス動画を生成できます。※2

【速報！新たなダンス生成AI登場】

Animate Anyone や Magic Animateとは異なる、ダンス生成AI「DreaMoving」がアリババが発表！

全身の画像は必要無く、顔のリファレンス画像とプロンプト+ポーズデータで構築するそうです。

続く>>#生成AI #AI動画 #DreaMoving pic.twitter.com/dmM1DMDTTy
— 田中義弘 | taziku CEO / AI × Creative (@taziku_co) December 11, 2023

全身の画像は必要なく、顔のリファレンス画像とプロンプト+ポーズデータで構築するので、使い勝手も良さそうですね。

デモ動画では、服装や背景をプロンプトで指定し、さまざまなダンスを踊っている動画が公開されています。

動画を生成するまでにかかった時間などは公表されていませんが、従来の方法でダンスのPVを1本撮るよりも早く生成できるのは間違いないでしょう。

実際の使用例

基本的にDreaMovingは、顔写真とポーズデータをアップロードして使用することを想定していますが、プロンプトや顔写真単体でもダンス動画を生成できます。

The Animate Anyone saga continues!

DreaMoving is yet another approach at generating high-quality videos of humans given a text prompt and some pose guidance. In this case, a reference image is used to preserve facial identity.https://t.co/Lak860Ps2N pic.twitter.com/grPboNLUOH
— Dreaming Tulpa 🥓👑 (@dreamingtulpa) December 16, 2023

DreaMovingでダンス動画を生成できるのは、以下の3パターンです。

顔の画像+ポーズデータ+プロンプトでダンス動画を生成
プロンプト単体でもダンス動画を生成可能
顔+服装など2つのデータをアップロードして動画を生成

AIで作られたとは思えないほどの高いクオリティが再現されていますね！

【 I2VGen-XL 】イメージ to ビデオ生成AI

I2VGen-XLは、アリババが発表した「画像から動画を生成できるイメージtoビデオAI」の新モデルです。

画像入力とプロンプトで指示することができ、テキスト記述を使用してビデオの内容を細かく制御できます。

【画像入力とプロンプト指示ができる】

アリババが画像から動画へのモデル「I2VGen-XL」をリリース

テキスト記述を使用してビデオの内容を細かく制御することが可能

・最大1280×720の解像度
・3500万のテキスト-ビデオペア
・60億のテキスト-イメージペア

アリババの進化が止まらない。

続く>> pic.twitter.com/jHMUPxySzw
— 木内翔大＠SHIFT AI代表「日本をAI先進国に」𝕏 (@shota7180) December 15, 2023

特徴としては、

オープンソースとしてリリース
最大1280×720の解像度
3500万のテキスト-ビデオペアで学習
60億のテキスト-イメージペアで学習

と高性能を誇っており、まるで映画やゲームのような美しい世界を表現しています。

I2VGen-XLの新しい点は、静止画像からビデオへの生成過程を分離し、各段階で特化した処理を行うことです。

これにより「意味的な生合成」と「ビデオの質」の両方を、同時に向上させることが可能になります。

実際の使用例

I2VGen-XLが統合されるプラットフォームやアプリは不明ですが、様々なシーンでの活用が期待されています。

I2VGen-XL: High-Quality Image-to-Video Synthesis via Cascaded Diffusion Models

Zhang et al.: https://t.co/7Ux9j0Vmpm #ArtificialIntelligence #DeepLearning #MachineLearning pic.twitter.com/hhJUg2LldO
— MONTREAL.AI (@Montreal_AI) December 17, 2023

製品紹介ビデオ
ブランドストーリーの展開
不動産や物件などのリアルエステート

など、現実社会と組み合わせた様々な使い方が想定されます。

画像を動画にするだけでなくストーリー性も考慮してくれるようなので、上手に使いこなすことで応用の幅が広がりそうですね。

【通義千問（Tongyi Qianwen）】自然言語処理モデル

通義千問（Tongyi Qianwen）は、アリババグループの自然言語処理モデルです。「通義千問」はモデルの中国語名で、そのほかの国では一般的に英語名の「Qwen」と呼ばれています。

テキストの生成、翻訳、要約、質問への回答など、さまざまな言語処理タスクを実行できます。

2025年4月29日には、「通義千問」の最新モデル「Qwen3」を公開しました。

Qwen3シリーズは、従来の「思考せず即時応答する」形式に加え、段階的に思考を進める「思考モード（Thinking Mode）」を併用可能なハイブリッド設計を採用しており、ユーザーは処理の精度と速度をタスクに応じて柔軟に制御できるようになっています。さらに119の言語・方言にも対応しています。

Introducing Qwen3!

We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC
— Qwen (@Alibaba_Qwen) April 28, 2025

通義千問は、さまざまな業界や用途で活用されていますが、特にEコマースやマーケティング・教育などの分野で、商品の説明やレビュー・広告の作成などでの活用が多い印象です。

実際の使用例

Qwen3は通義千問の性能をさらに向上させたモデルであり、より複雑なタスクや創造的なタスクにも対応できます。

前のバージョン（Qwen2.5）に比べて推論能力が大幅に向上しており、特に数学やコーディング、論理的推論において優れた性能を発揮します。特に、Qwen3のフラッグシップモデルである「Qwen3-235B-A22B」は、高い推論能力を誇るDeepSeek R1と比較しても多くのベンチマークで優れた結果を出しています。

また、 テキスト・画像・音声・動画を統合的に処理する高い能力も備えており、創造的なタスクにも対応可能です。

さらに、Qwen3はオープンソースとして無料公開されており、世界中の開発者から注目されています。

特徴は以下のとおり。

トレーニングとデータ：Qwen3は中国語、英語、多言語テキスト、コード、数学など、一般分野から専門分野までを含む 36兆トークンという巨大なデータセットでトレーニングされています。（前世代のQwen2.5の約2倍の規模）
パフォーマンス：代表的なLLMであるOpenAI o1など他の競合モデルより多くのタスクで優れた性能を発揮しています。
エージェント機能：エージェント機能の強化により外部ツールとの統合が容易で、複雑なエージェントベースのタスクにおいても優れたパフォーマンスを発揮します。
より長いコンテキストのサポート： Qwen3は32kのコンテキスト長をサポートしています。
多言語対応：日本語を含む119の言語と方言に対応しています。

なお、Qwen3について詳しく知りたい方はこちらの記事をご覧ください。

WEEL

【Qwen 3】アリババ発の最新LLMファミリー｜概要から使い方まで徹底解説 | WEEL 押さえておきたいポイント「Thinking」モードをオン/オフできる設計 Apache2.0ライセンスのもとでOSSで提供クラウドだけでなくローカルでも利用可能 2025年4月29日、Alib…

【通義万相】画像生成AI

通義万相は、アリババグループから公開された画像生成モデルです。

テキストによる指示を入力すると、水彩画、油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D漫画などリアルで創造的な画像を生成できます。

中国企業「アリババ」が画像生成AI「通義万相」を発表。βテスト中。

アリババクラウド•インテリジェンスの最高技術責任者「通義万相のリリースにより、高品質な生成画像がより身近になり、Eコマース•ゲーム•デザイン•広告など幅広い分野で革新的なAIアートや創造的な表現の開発が進むでしょう」 pic.twitter.com/yki4JFcbyb
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) July 9, 2023

通義万相は、画像生成AIの新たな可能性を示すモデルとして、さまざまな業界や用途で活用されることが期待されています。

テキストによる指示で、さまざまな画像を生成できる
高解像度で、創造性の高い画像を生成する
空間レイアウトやパレットなどの最終的な画像の生成を細かく制御できる

など、今後のさらなる進化が期待されています。

実際の使用例

通義万相の具体的な応用例としては、以下のようなものが挙げられます。

Eコマース：商品の画像や広告の作成、顧客の視覚体験を向上させる
マーケティング：キャンペーンやコンテンツの作成、ターゲティングの精度向上
教育：教材やイラストの作成、創造性の育成
エンターテインメント：映画やアニメの制作、新たな表現方法の創造

ビジネス、教育、エンターテインメントなど、実生活においても幅広い分野で活用されそうですね。

【通義仁心】医療AIモデル

通義仁心（Tongyi Renxin）はアリババグループによって開発されたAI技術で、特に医療分野での応用に焦点を当てています。

この技術は、医療データの分析や診断支援を目的としており、医師の判断を補助するための情報提供を行います。

膨大な量の医療データでトレーニングされており、高い精度で医療タスクを実行できる
テキストや画像、音声などのさまざまなデータ形式を処理できる
自然言語処理や機械学習などの技術を活用することで、複雑な判断や推論を行うことができる

などの特徴を有しており、医療サービスの質を向上させると共に、効率化を促進するためのツールとして期待されています。

実際の使用例

通義仁心は、さまざまな医療タスクをサポートします。

例えば、以下のような用途が期待されています。

医療文書の解析：医療文書の中から、必要な情報を効率的に抽出する
診断支援：医療画像や検査結果などのデータを分析し、診断の精度を向上させる
治療アドバイス：患者の状態や治療の進捗状況を把握し、適切な治療方法をアドバイスする

このような情報を共有することで、医療AIソリューションを提供することにもつながります。

このように通義仁心は、医療の質の向上や効率化に貢献する可能性を秘めたモデルです。

通義仁心は、まだ開発途上ですが、今後さらに高度な医療AIモデルへと進化していくことが期待されています。

【通義点金】金融AIモデル

通義点金（Tongyi Dianjin）は、アリババが開発した金融AIモデルです。

財務データの分析、投資のアドバイス、リスク管理など、さまざまな金融タスクをサポートします。

通義点金は、膨大な量の金融データでトレーニングされており、テキストや画像、音声などのさまざまなデータ形式を処理できます。

また、自然言語処理や機械学習などの技術を活用することで、金融に関する複雑な判断や推論を行うことができます。

通義点金の具体的な特徴は、以下のとおりです。

膨大な量の金融データでトレーニングされており、高い精度で金融タスクを実行できる
テキストや画像、音声などのさまざまなデータ形式を処理できる
自然言語処理や機械学習などの技術を活用することで、複雑な判断や推論を行うことができる

専門的な知識が必要な金融業界において、大きな活躍が期待されています。

実際の使用例

通義点金の活用事例としては、以下のようなものが挙げられます。

財務データの分析：財務データから、企業の財務状況や経営状況を分析できる
投資のアドバイス：市場状況や企業の業績などを分析し、投資のタイミングや銘柄をアドバイスする
リスク管理：市場のリスクを分析し、リスクを回避するための対策を講じる

通義点金は、金融の効率化やリスク管理に貢献する可能性を秘めたモデルです。

今後、さらなる開発・改良が進められることで、さらに幅広い用途で活用されることが期待されています。

研究が進み実用性を広げられれば、金融の世界も大きく変えてしまいそうですね。

【通義暁蜜（Tongyi Xiaomi）】カスタマーサービスAIモデル

「通義暁蜜（Tongyi Xiaomi）」は、アリババ社が開発したカスタマーサービスAIモデルです。

カスタマーサービスのシナリオに特化して設計されたモデルで、顧客の意図を推論しながら適切な応答を提供します。

自然言語の理解や分析、推論の能力を有しており、音声の認識、翻訳、要約、質問への回答など、さまざまな音声処理タスクを実行できます。

通義暁蜜の具体的な特徴は、以下のとおりです。

膨大な量の音声データでトレーニングされており、高い精度で音声処理タスクを実行できる
音声の意味を理解し、新たな音声を生成できる
複雑な文脈を理解したり、創造的な音声を生成できる

通義暁蜜は、膨大な量の音声データでトレーニングされており、音声の意味を理解して生成できます。

また、自然言語処理や機械学習などの技術を活用することで、複雑な文脈を理解したり創造的な音声を生成することを得意としています。

実際の使用例

通義暁蜜のできることとしては、以下のようなものが挙げられます。

音声認識：音声をテキストに変換できる
音声翻訳：音声を翻訳できる
音声要約：音声を要約できる
音声質問への回答：質問に対して、音声で回答できる

通義暁蜜は、さまざまな業界や用途で活用されることが期待されています。

例えば、Eコマースでは、顧客の音声による注文や問い合わせの対応に利用されています。

マーケティングでは、効果的な音声コンテンツの作成に利用されています。教育では、学習支援や教材の作成に利用されています。

具体的な活用事例としては、以下のようなものが挙げられます。

顧客音声による注文や問い合わせの対応
顧客ニーズを理解し、迅速かつ正確に対応する
効果的な音声コンテンツの作成

カスタマーサポートを全てAIが行う、そんな未来も遠くないかもしれませんね。

【通義法睿（Tongyi Farui）】法律AIモデル

「通義法睿（Tongyi Farui）」は、アリババグループによって作られた法律AIモデルです。

法律専門家の業務効率向上をサポートするためにデザインされています。

「通義法睿（Tongyi Farui）」は、法的調査や法的関連の問い合わせへの回答、訴訟ケースの分析、法的文書の起草などのタスクを遂行します。

特徴は以下のとおりです。

・法律文書と判例の理解と分析に特化したAI
・自然言語処理と法解釈学習を通じた知識構築
・法廷判断の予測と法務処理の自動化が主目的

難しい判断や解釈が求められる法律の世界において、サポートしてくれるAIの存在は重要なものになっていきそうですね。

実際の使用例

通義法睿の使用例は、以下のとおりです。

法律文書の要約自動生成
裁判記録や判例文から重要ポイントを抽出し要約作成
判断結果や量刑期間の予測
裁判での判決予測に利用し判断材料を弁護士に提供
法律相談への自動応答
契約関連文書の精査
契約条項の確認、解説作成、修正案提示など契約支援

専門知識や深い情報が必要な分野でも、AIの活躍する機会が増えていきそうです。

まとめ

本記事で紹介したアリババグループ「Alibaba Cloud」の生成AIツールは以下のとおりです。

【Animate Anyone】キャラクター生成AI
【Outfit Anyone】仮想試着ツール
【DreaMoving】ダンス動画生成AI
【 I2VGen-XL 】イメージ to ビデオ生成AI
【通義千問（Tongyi Qianwen）】自然言語処理モデル
【通義万相】画像生成AI
【通義仁心】医療AIモデル
【通義点金】金融AIモデル
【通義暁蜜（Tongyi Xiaomi）】カスタマーサービスAIモデル
【通義法睿（Tongyi Farui）】法律AIモデル

世界中で様々な生成AIがリリースされていますが、アリババのAIは精度も高く幅広い応用が期待されています。

興味を持ったAIがあれば、ぜひ使ってみてください。

生成系AIの業務活用なら！

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

無料ダウンロード

最後に

いかがだったでしょうか？

中国発の先進AIに注目が集まる今、貴社のプロダクトに革新をもたらす活用方法を検討してみませんか？

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです！

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70％自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80％削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ