中国製GPUで学習したLLMがLlama3-8Bを超える性能を発表
![GPU MT-infini-3B 无聞芯穹 Moore Threads](https://weel.co.jp/wp-content/uploads/2024/05/00.jpg)
中国のGPUメーカー「摩爾線程(Moore Threads)」は、自社開発のGPUを使用して、大規模言語モデル「MT-infini-3B」を発表しました。
このNEWSをAIが簡単要約
- 中国のMoore Threadsが自社製GPUでMT-infini-3Bを開発。
- MT-infini-3BはLlama3-8Bを超える性能を示す。
- 学習は无聞芯穹のAIプラットフォームで実行。
MT-infini-3Bは、NVIDIA製のGPUで学習された大規模言語モデルに匹敵するか、またはそれ以上の性能を持ち、パラメーター数は30億。
![](https://weel.co.jp/wp-content/uploads/2024/05/u3lymgrylw-1024x741.png)
学習には合計13. 2日を要し、使用されたGPUのモデル名は公開されていません。
ベンチマーク結果では、MT-infini-3Bは80億パラメーターを持つLlama3-8Bを超える性能を示しました。
MT-infini-3Bの学習には、中国企業「无聞芯穹」が提供するAI学習プラットフォームが使用。
无聞芯穹のCEO、夏立雪氏は、MT-infini-3Bが中国製GPUを使って初めから終わりまで学習された初の大規模言語モデルであることを強調しています。
参考記事:摩爾線程ー企業情報
生成AIを社内で活用していきたい方へ
![](https://weel.co.jp/wp-content/uploads/2023/10/image-6-1024x468.png)
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。