Kneron、次世代エッジAI技術を発表

AI

2024-06-06

Koneron 次世代エッジAI技術

Kneronは、AI推論とファインチューニングをエッジで行うための次世代シリコンとサーバー技術を発表しました。

このNEWSをAIが簡単要約

Kneronが次世代シリコンとサーバー技術を発表。
KL830は低電力で高性能、言語モデル特化。
ローカルGPTサーバー運用で企業向け柔軟性向上。

新しい「KL830」NPUと「KNEO 330」エッジGPTサーバーは、企業がオンプレミスで手頃な価格でGPTデプロイメントを実現できるように設計されています。

KL830は低電力消費で高性能を提供し、言語モデルに特化。

ソフトウェアの面でも強化が行われており、オープンモデルのファインチューニングやTensorFlow、Caffe、MXNetなどのフレームワークでトレーニングされたモデルのコンパイルが可能です。

また、KL830はRAGワークフローをサポートし、大規模ベクトルデータベースのメモリニーズを削減する構造を持っています。

Koneron 次世代エッジAI技術

Kneronの技術は、GPU以外の技術を使用してAIワークロードの電力効率を向上させることを目指すGroqやSambaNovaなどのベンダーの一部であり、特に低電力消費が特徴です。

KL830のピーク電力消費はわずか2ワットであり、それでも10eTOPS@8bit（※）の統合計算能力を提供します。

この低電力消費により、追加の冷却ソリューションを必要とせず、PCなどの様々なデバイスに統合できるため、エンジニアやデータサイエンティストにとって高い柔軟性が実現可能です。

この新技術により、企業はネットワークエッジでの推論を行うためのローカルGPTサーバーを運用でき、AIおよび自動化チームの採用障壁が大幅に低くなります。

Kneronは、デジタルツインとシミュレーションを支援するための直感的なビジュアルツールを提供し、複数のオープンモデルを組み合わせてファインチューニングを行っています。

※10eTOPS@8bitの統合計算能力：8ビット精度で1秒あたり10テラ（10兆）操作（TOPS: Tera Operations Per Second）を処理できる計算能力を指す。8ビット精度とは、計算に使用されるデータの各部分が8ビットで表されることを意味し、高速かつ効率的な処理が可能。このような高い処理能力は、AIモデルの推論やトレーニングなどで重要になる。

参考記事：Kneron

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。

最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

メルマガに登録する

資料をダウンロードする

AI

URLをコピーしました！

URLをコピーしました！

「日本一透明性の高いAIプロフェッショナル集団」
を目指して

私たちは、AIに関わるすべての人に向けて、透明性の高い適切な情報発信と開発を行います。
「WEELは、一番地に足ついたAI情報を教えてくれる」
と思っていただけるよう、透明性高い事業運営を行なって参ります。

私たちは、AIに関わるすべての人に向けて、
透明性の高い適切な情報発信と開発を行います。
「WEELは、
一番地に足ついたAI情報を教えてくれる」
と思っていただけるよう、
透明性高い事業運営を行なって参ります。

無料で相談してみる

会社紹介資料ダウンロード

通勤時間で読める

生成AIメールマガジンを読む