AIチップが画像認識を加速
VLSI Symposium 2020で発表されたフランスの研究機関CEA-LetiとLISTの概念実証チップは、低電力IoTノードとAIアクセラレータを組み込んでおり、ピークから15,000倍の超高速ウェイクアップ時間を示しています。アイドル電力消費の削減。ノードは、ワットあたり1秒あたり最大1.3テラの操作(TOPS / W)、または機械学習タスクの場合は36GOPSを提供します。
SamurAIという名前のチップは、PIRセンサー、224×224ピクセルの白黒カメラ、FeRAM、低電力無線機などの既製のコンポーネントを備えた占有検知システムでテストされました。 1日の平均システム消費電力は105µWで、SamurAIはその予算の26%を消費していました。システムは、1日8時間の部屋の占有中に、5秒間隔でPIRセンサーを使用し、カメラは1秒あたり1フレーム、ラジオは1日あたり10倍でした。
SamurAIシステム
SamurAIは、2つのオンチップサブシステムを使用します。207nsで起動できる低電力のクロックレスイベント駆動型ウェイクアップコントローラーと、ディープスリープモードとPNeuroAIアクセラレータを備えたRISC-VCPUで構成されるオンデマンドサブシステムです。および暗号化アクセラレータ。
このデュアルサブシステムスキームにより、15,000倍のピーク対アイドル電力比が可能になります。次の図は、さまざまなモードでの消費電力を示しています。アイドルモードはわずか6.4µWを消費します。 CPUとAIアクセラレータを実行すると、消費電力は96mWになります。
このチップは、STMicroの28 nmの完全に空乏化したシリコンオンインシュレータ(FD-SOI)プロセスに基づいて構築されており、電力の数値はボディバイアスなしで示されています。シリコンは4.5mm 2 6つの切り替え可能な電源ドメインがあります。
電力モードによるSamurAIの消費電力測定(モードはLR:アイドル、ウェイクアップコントローラー(WuC)のみ、ウェイクアップコントローラーとウェイクアップラジオ(WuR)、ウェイクアップコントローラーと周辺機器、およびCPUの実行(画像:CEA-Leti)
AIアクセラレータ
チームがPNeuroと呼ぶ設計であるチップのAIアクセラレータは、単一命令、複数データ(SIMD)のプログラム可能なアクセラレータです。これは、264kBマルチバンクSRAMを備えた32x8ビット処理エレメントの2つのクラスターで構成されています。サイクルごとに最大64の積和演算(MAC)を実行できます。 PNeuroブロックは、2.8 GOPS /0.48Vで1.3TOPS / Wを達成できます。 8ビットの完全に接続されたニューラルネットワークレイヤーに対して、0.9Vで最大36GOPSを実行できます。
PNeuroアクセラレータを使用すると、ML計算にコントローラRISC-Vコアを使用した場合と比較して、システムの総消費電力が2.3分の1に削減されました。
この設計は、長期間の「スリープ」の間に散発的な計算能力を必要とするIoTアプリケーションを対象としています。クラウドに接続するのではなく、ノードがAIワークロード自体を処理できる場合、これは多くの場合、より迅速に完了することができ、データはシステムの外部で共有されないため、プライバシーへの影響はありません。これには、カメラやその他のセンサーを使用した人物検出やシーン識別などのアプリケーションが含まれる場合があります。
>>この記事はもともと姉妹サイトであるEETimesEurope。
埋め込み