Kneron、次世代エッジAI技術を発表

Koneron 次世代エッジAI技術

Kneronは、AI推論とファインチューニングをエッジで行うための次世代シリコンとサーバー技術を発表しました。

このNEWSをAIが簡単要約
  • Kneronが次世代シリコンとサーバー技術を発表。
  • KL830は低電力で高性能、言語モデル特化。
  • ローカルGPTサーバー運用で企業向け柔軟性向上。

新しい「KL830」NPUと「KNEO 330」エッジGPTサーバーは、企業がオンプレミスで手頃な価格でGPTデプロイメントを実現できるように設計されています。

KL830は低電力消費で高性能を提供し、言語モデルに特化。

ソフトウェアの面でも強化が行われており、オープンモデルのファインチューニングやTensorFlow、Caffe、MXNetなどのフレームワークでトレーニングされたモデルのコンパイルが可能です。

また、KL830はRAGワークフローをサポートし、大規模ベクトルデータベースのメモリニーズを削減する構造を持っています。

Koneron 次世代エッジAI技術

Kneronの技術は、GPU以外の技術を使用してAIワークロードの電力効率を向上させることを目指すGroqやSambaNovaなどのベンダーの一部であり、特に低電力消費が特徴です。

KL830のピーク電力消費はわずか2ワットであり、それでも10eTOPS@8bit(※)の統合計算能力を提供します。

この低電力消費により、追加の冷却ソリューションを必要とせず、PCなどの様々なデバイスに統合できるため、エンジニアやデータサイエンティストにとって高い柔軟性が実現可能です。

この新技術により、企業はネットワークエッジでの推論を行うためのローカルGPTサーバーを運用でき、AIおよび自動化チームの採用障壁が大幅に低くなります。

Kneronは、デジタルツインとシミュレーションを支援するための直感的なビジュアルツールを提供し、複数のオープンモデルを組み合わせてファインチューニングを行っています。

※10eTOPS@8bitの統合計算能力:8ビット精度で1秒あたり10テラ(10兆)操作(TOPS: Tera Operations Per Second)を処理できる計算能力を指す。8ビット精度とは、計算に使用されるデータの各部分が8ビットで表されることを意味し、高速かつ効率的な処理が可能。このような高い処理能力は、AIモデルの推論やトレーニングなどで重要になる。

参考記事:Kneron

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次