中国のおすすめ最強LLMまとめ！OpenAIのライバル生成AI企業から話題のAIツールまで紹介

AIトリビア

2023-12-182024-04-03

現在多くの生成AIが発表されており、様々な分野で応用され始めています。ChatGPTは生成AIの代名詞となり、その性能や可能性が広く認知されました。

生成AIの開発には高度な技術と大量のデータが必要で、世界的に競争が激化しています。今回取り上げる中国では、国家レベルでAIの開発を支援する政策を打ち出し、多くのテック企業や研究機関が生成AIの開発に取り組んでいます。

ここでは、中国のAI業界で活躍する企業、および高精度のLLMモデルについて紹介いたします。

中国の有名なLLM開発企業

中国においても、生成AIの開発は活発に行われています。

生成AIを開発している会社は数多く有りますが、その中でもChatGPTを開発したOpen AIにも劣らないと思われる高精度の生成AIを発表している会社も存在します。

今回は高精度の大規模学習モデル（LLM）を開発している会社を3社紹介します。

アリババ

アリババグループは中国を代表する世界的なテクノロジー企業です。

もちろん生成AIの開発にも力を入れており、2023年には画像を生成するAI「通義万相」や、精緻な文章などを作成できる生成AI「通義千問」を開発しています。

また、生成AIの導入を支援するサービスも始めています。

バイドゥ

バイドゥは、中華人民共和国で最大の検索エンジンを提供する会社で、全世界の検索エンジン市場においてGoogleに次いで第2位となっています。

バイドゥはAI技術にも力を入れており、その一環として「文心一言」（Ermie Bot）という会話型AIを開発しました。また、AI解放プラットフォームを提供もしています。

Introducing ERNIE Bot, Baidu's latest generative AI mastering Chinese language, multi-modal generation & more. ERNIE Bot is accessible to invited users and will soon be made available to more users, as well as enterprise clients via Baidu AI Cloud. ⬇️
— Baidu Inc. (@Baidu_Inc) March 17, 2023

バイトダンス

バイトダンス（ByteDance）は、中国のテクノロジー企業で、TikTokや抖音（Douyin）などのショートビデオアプリを運営しており、生成AI「Magic Animate」を発表しています。

また、ニュースアプリではToutiaoやTopBuzz等のアプリを提供しており、AIを活用してユーザーの興味・嗜好に合わせた配信を行っています。

ChatGPTと並ぶレベルの中国産生成AI

中国の生成AIはソリューションの形で提供することを想定されています。このため特定の業界や企業に向けたAIモデルを開発し、そのニーズに応えることを目指していて、チャットボットという公開の仕方には消極的でした。

しかし、ChatGPTのブームを受けて、中国のテック企業もチャットインターフェースをつけた生成AIを発表するようになりました。

ここでは、ChatGPTと並ぶレベルの中国産生成AIを紹介いたします。

文心一言（Ernie bot）

Announcing ERNIE Bot, Baidu's latest generative AI product! A powerful large language model with impressive capabilities in literary creation, business writing, math reasoning, Chinese language comprehension, and multimodal generation. #ERNIEBot pic.twitter.com/xBYo1l9lFv
— Baidu Inc. (@Baidu_Inc) March 16, 2023

「文心一言」はバイドゥが発表した対話型生成AIです。文章作成能力の他、画像生成機能を持つ。

総合的な能力はChatGPTに及ばないものの、中国語においては高い言語処理能力を持ちます。

文心一言のLLMの学習データは、数兆件のウェブデータ、数十億件の検索データや画像データ、1日平均数百億件の音声通話データ、5,500億件の事実に関する知識グラフとされている。

通義千問（Qwen）シリーズ

Qwenシリーズはアリババが開発したLLMのシリーズです。

Qwenとは「通義千問」という意味で、自然言語理解や生成、対話などの様々なタスクに対応できることを目指しています。

Qwenシリーズは、以下のような時系列で公開されています。

Qwen-7B

2023年8月にQwen-7Bが発表されました。これは70億パラメータを有する大規模言語モデルです。同等サイズのモデルと比較すると、圧倒的なパフォーマンスを出しています。

その理由としては2つあり、一つは学習データが2.2兆トークンで学習していることです。もう一つの理由はトークナイザのボキャブラリ量にあり、15万以上を扱えます。

ボキャブラリーが多いことは、表現力・対応力に影響しますのでその分が優秀となっていると言えます。

これらの相乗効果により特に、自然言語の理解や数学、コーディングのタスクでは優秀な実力を発揮しています。

Qwen-14B

2023年10月3日にQwen-14Bが発表されました。Qwen-7Bの発展モデルでこれは140億パラメータ、３兆トークンを有するLLMで、チャットモデルとしても利用することができる対話型の生成AIとなっています。中国語・英語で学習されたモデルで多言語に対応したモデルになっています。

大量の高品質データを学習したことにより、このモデルは高度な推論、認知、および問題解決能力を持っています。

Qwen-72B

2023年11月30日、中国の中国の大手IT企業アリババが、72Bパラメータを持つ大規模言語モデル「Qwen-72B」を公開しました。

Qwen-72Bは一般分野から専門分野までを含む 3兆トークンという巨大なデータセットでトレーニングされています。データセットには、中国語、英語、多言語テキスト、コード、数学などが含まれています。

2023年12月現在公開されているオープンソースのLLMの中でも最高クラスの性能を持っています。

大きなサイズと複雑さにも関わらず、Qwen-72Bは低コストで運用できるモデルになっています。最小限のメモリ使用（3GB未満）で運用できるため、様々なアプリケーションで利用可能となっています。

We are proud to present our sincere open-source works: Qwen-72B and Qwen-1.8B! Including Base, Chat and Quantized versions!

🌟 Qwen-72B has been trained on high-quality data consisting of 3T tokens, boasting a larger parameter scale and more training data to achieve a… pic.twitter.com/VUAMbh83At
— Binyuan Hui (@huybery) November 30, 2023

Qwen-1.8B

2023年11月30日に公開されたこのモデルは18億パラメータを持つLLMです。

他のシリーズと比べてパラメータは小さいものとなっていますが「特定のタスクに特化させる」というスタンスのモデルです。

BBHやAGIEvalなどのベンチマークでは強力なパフォーマンスを示しているモデルとなっています。

Qwen-audio

Qwen-Audioは、11月30日に発表された大規模音声言語モデルで、Qwenという大規模モデルシリーズの多モーダルバージョンです。

Qwen-7BとOpenAIの音声エンコーダーであるWhisper-large-v2を組み合わせたもので、マルチタスク音声言語モデルとなります。

複数のオーディオ分析、音声理解と推論を行うことが可能で、音声に特化した生成AIとなっています。中国語、英語を中心に、日本語、韓国語、ドイツ語、スペイン語、イタリア語での音声理解をサポートしています。

通義万相

通義万相は、2023年7月にアリババグループから発表された画像生成AIです。

中国語や英語のテキストプロンプトに応答し、水彩画、油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D漫画など、多様なスタイルのディテールに富んだ画像を生成します。

独自の大型モデルであるComposerを使用して開発され、画像合成の品質と創造性を維持しながら、空間レイアウトやパレットなどの最終的な画像出力をより細かく制御しています。

零一万物（Yi）シリーズ

Yi-6b（同シリーズにYi-6b-200k）

Yi-6bは2023年11月2日に公開された大規模言語モデルで、60億のパラメータを持っているモデルです。

主に中国語と英語で一般分野から専門分野までを含む大規模なデータセットでトレーニングされています。日本語でも問題なく出力されるみたいです。

パフォーマンスは一連のベンチマークで、同サイズのモデルであるLLaMA2-70bを上回る性能を示しており、現在公開されているLLMの中でも高い性能を有しています。

Yi-6kは4Kのシーケンス長でトレーニングされています。同シリーズのYi-6b-200kは200kの非常に長い文章をサポートしています。

Yi-34b（同シリーズにYi-34b-200k）

Yi34bは2023年11月2日にYi6bと同時に公開された大規模言語モデルで、340億のパラメータを持っているモデルです。パラメータ量の増大により、Yi-6bよりパフォーマンスが上昇しています。

Yiシリーズは、自然言語理解や生成、コーディング、数学などのタスクに対応できるとされ、さまざまなベンチマークで高い性能を示しました。

同シリーズであるYi-34b-200kは20万トークンに対応し、漢字約40万字の入力が可能となっています。

Hunyuan（混元）

Hunyuanは、中国の大手IT企業テンセントが開発した大規模言語モデルで、1000億以上のパラメータを持っています。Hunyuanは、2兆以上のトークンを含む大規模なデータセットでトレーニングされています。

Hunyuanは、数千語の長文生成や複雑な数学問題の解決など、OpenAIのChatGPTをいくつかの面で上回る性能を示しているようです。

というのも、中国の企業がテンセントクラウド上のAPIを使用してテストおよびアプリの構築が可能となるモデルであり、実際に確認することはできません。

Skywork-13B

Skyworkは、「昆仑万维集团・天工团队」によって開発されたLLMのシリーズです。およそ130億ものパラメータを持っており、中国語と英語のデータセットで学習されています。学習トークンは3.2兆を超えています。各種ベンチマークは次の通りで好得点を出しています。

以下の4つの主要なLLMが存在し、今後も様々なモデルを公開していく予定とのことです。

・Skywork-13B-Base：基本的なモデルで、様々なベンチマークテストで優れた性能を発揮
・Skywork-13B-Chat：会話能力に特化しており、特に創造的な文章を書くのが得意
・Skywork-13B-Math：数学的な能力に特化したモデル
・Skywork-13B-MM：マルチモーダルモデルで、画像情報を利用してQ&Aや対話などのタスクをこなせる

DeepSeek-LLM-7B/67B-Base、DepSeek-LLM-7B/67B-Chat

各種DeepSeekLLMシリーズは、2023年11月29日にDeepSeek AI社より発表された大規模言語モデルで70億（670億）パラメータを持っているモデルです。英語と中国語で一般分野から専門分野までを含む大規模なデータセットでトレーニングされています。

DeepSeek-LLM-67B-Baseは推論、コーディング、数学、中国語理解などの分野で、同サイズのモデルであるLlama2 70B Baseを上回る性能を示しています。

また、DeepSeek LLM-67B-Chatは、コーディングと数学で優れたパフォーマンスを発揮しています。

BaseとChatの違いは以下のようになります。

DeepSeek-LLM-67B-Base：一般的な言語理解タスクに対応
DeepSeek LLM-67B-Chat：対話や指示に基づくタスクに特化

🌟 Performance Highlights

🏆 DeepSeek LLM 67B Base surpasses Llama2 70B Base in general capabilities.
💻 DeepSeek LLM 67B Chat performs exceptionally well in coding, mathematics, and reasoning. pic.twitter.com/Y9uVNYAq2l
— DeepSeek (@deepseek_ai) November 29, 2023

Xwin-LMシリーズ（7B, 13B, 70B）

Xwin-LMは、大規模言語モデル（LLM）のためのアライメント技術を開発し、オープンソース化することを目的としたプロジェクトです。

2023年9月、Xwin-LM-70B-V0.1、Xwin-LM-13B-V0.1、Xwin-LM-7B-V0.1という異なるサイズのモデルを開発、公開しました。これにより、ユーザーは異なるニーズやリソースに合わせて最適なモデルを選択できます。

以下の表のとおりAlpacaEvalのベンチマークで高いパフォーマンスを発揮しています。

2023年10月12日にXwin-LM-13BとXwin-LM-7BはV0.2の改良版が公開されています。

MagicAnimate

2023年10月27日に、人物やキャラクターの静止画や動画と、モーションシーケンスデータを組み合わせて、動画を生成できる動画生成モデル「MagicAnimate」を発表しました。

MagicAnimateは、時間情報を符号化するためのビデオ拡散モデルと、フレーム間の外観の一貫性を維持するための新しい外観エンコーダを導入しています。

これにより時間的一貫性の向上、参照画像の忠実な保存、アニメーションの忠実度の向上を実現しました。

AnimateAnyone

Animate Anyoneは、2023年11月にアリババグループの研究チームが発表した、画像1枚から高品質なアニメーションを作成できる技術です。

一貫性と制御可能な動きを持つ高品質なキャラクターアニメーションビデオを生成することを目指しており、時間情報をエンコードするためのビデオ拡散モデルを開発しています。

また画像の詳細な特徴を抽出する「ReferenceNet」と、動きを指定する「MotionNet」という2つのネットワークが導入されています。

なお、Animate Anyoneについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Animate Anyone】一枚の画像だけで好きなアニメキャラや人を思い通りに動かせる最新AIの仕組みを解説

中国LLMは今後進化していく

中国のLLMについてまとめましたが、LLMの数を見ても発表されたばかりのものも多く、出遅れているという感はあります。

中国の企業の多くはソリューションの形で提供することが考えられており、Chat GPTのような形で公開は考えられてなかったのも大きいです。

中国にもLLMの基盤は整っており、実践活用の分野で追いつこうとしています。

生成AIは今後もアメリカと中国が競い合いながら進化をしていくことでしょう。

生成系AIの業務活用なら！

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

無料ダウンロード

弊社では法人向け生成AI研修・勉強会を行なっています

いかがだったでしょうか？

弊社では、法人様向けに生成AI研修を行なっております。
また、研修に加えて本事業の支援も行わせていただいております。

詳しくはこちらをご覧ください！
セミナー実績 | WEEL

研修をさせていただいた企業様からは、以下のような好評をいただいております。

生成AIについて包括的に理解ができ、多くの業務で生成AIが活用されるようになった。
生成AIの事例を知ることで、社内で生成AIを活用するためのアイデアがたくさん出てくるようになった。
全社で生成AIに関する認識を共有できたので、生成AIに関するプロジェクトの理解が得られるようになった。

研修の内容としては、以下のようなものになっています。

1. 生成AIの概要
2. 生成AIの歴史
3. 生成AIのリスク・対応策
4. 生成AIの活用事例
5. 生成AIの未来予測
6. 〇〇業界特有の生成AI活用法（様々な業界に対応）
7. プロンプトエンジニアリング実践（ChatGPTや画像生成AIへの入力文）
8. AI開発実践（Pythonプログラミング）
9. 生成AIの社内導入手順