ニューロモルフィックコンピューティング開発キットのデビュー
ニューロモルフィックコンピューティングIPベンダーであるBrainChipは、最近のLinley Fall Processor Conferenceで、Akidaニューロモルフィックプロセッサ用の2つの開発キットを発表しました。どちらのキットにも、同社のAkidaニューロモルフィックSoC(x86シャトルPC開発キットとArmベースのRaspberry Piキット)が搭載されています。 BrainChipは、IPのライセンスを取得することを期待して、スパイキングニューラルネットワークプロセッサを使用する開発者にツールを提供しています。秋田シリコンもご用意しております。
BrainChipのニューロモルフィック技術は、センサーデータの非常に低電力のリアルタイム処理が求められるエッジシステムのデータを分析するための超低電力AIを可能にします。同社は、主流の深層学習アプローチとは異なる、脳に触発されたニューラルネットワークであるスパイキングニューラルネットワーク(SNN)を処理するように設計されたニューラル処理ユニット(NPU)を開発しました。脳のように、SNNは情報を空間的および時間的に伝達する「スパイク」に依存しています。つまり、脳はシーケンスとスパイクのタイミングの両方を認識します。 「イベントドメイン」と呼ばれるスパイクは、通常、センサーデータの変更(たとえば、イベントベースのカメラのピクセルカラーの変更)に起因します。
BrainChipのNPUは、SNNに加えて、他のエッジ実装よりも低い電力で、コンピュータービジョンやキーワードスポッティングアルゴリズムで通常使用されるような畳み込みニューラルネットワーク(CNN)を処理することもできます。これは、CNNをSNNに変換し、イベントドメインで推論を実行することによって行われます。このアプローチでは、エッジでのオンチップ学習、変換されたCNNに拡張されるSNNの品質も可能になります。
BrainChipの開発ボードは、x86シャトルPCまたはRaspberryPiで使用できます。 (出典:BrainChip)
秋田氏は「明日のニューロモルフィックテクノロジーの準備はできていますが、エッジデバイスとIoTデバイスでニューラルネットワークの推論を可能にするという今日の問題を解決します」と、BrainChipの共同創設者兼最高開発責任者であるAnilMankar氏は EE Times に語りました。 。
CNNからイベントドメインへの変換は、BrainChipのソフトウェアツールフローであるMetaTFによって実行されます。データはスパイクに変換でき、トレーニング済みモデルはBrainChipのNPUで実行するように変換できます。
「私たちのランタイムソフトウェアは、「SNNとは何ですか?」と「イベントドメインとは何ですか?」から恐怖を取り除きます」とMankar氏は述べています。 「私たちはそれを隠すためにあらゆることをします。
「TensorFlowまたはKerasAPIに精通している人は、[他のハードウェア]、同じネットワーク、同じデータセットで実行しているアプリケーションを、量子化対応のトレーニングで取得し、ハードウェアで実行して、電力を測定することができます。精度がどうなるか見てみましょう。」
CNNは、大規模なデータセットから特徴を抽出するのに特に優れているとMankarは説明し、イベントドメインへの変換はその利点を維持します。畳み込み演算は、ほとんどのレイヤーのイベントドメインで実行されますが、最後のレイヤーが置き換えられます。入ってくるスパイクを認識するレイヤーで置き換えると、通常のCNNは、エッジでのスパイクタイミングに依存する可塑性を介して学習できるようになり、クラウドでの再トレーニングが不要になります。
ネイティブSNN(イベントドメイン用にゼロから作成されたもの)は1ビットの精度を使用できますが、変換されたCNNには1ビット、2ビット、または4ビットのスパイクが必要です。 BrainChipの量子化ツールは、設計者がレイヤーごとにどれだけ積極的に量子化するかを決定するのに役立ちます。 Brainchipは、4ビットに量子化した後の予測精度が93.1%で、10オブジェクト分類のためにMobileNetV1を量子化しました。
イベントドメインへの変換の副産物は、スパース性による大幅な電力節約です。ゼロ以外のアクティベーションマップ値は1〜4ビットのイベントとして表され、NPUはアクティベーションマップ全体ではなく、イベントに対してのみ計算を実行します。
開発者は「重みを見て、ゼロ以外の重みを確認し、ゼロの重みによる乗算を回避しようとすることができます」とMankar氏は述べています。 「しかし、それはゼロがどこにあるかを知る必要があり、それらの操作には計算が必要であることを意味します。」
通常のCNNの場合、ReLU関数はゼロを中心としているため、アクティベーションマップはビデオフレームごとに変化します。通常、アクティベーションの半分はゼロになります。これらのゼロからスパイクを作成しないことにより、イベントドメインでの計算はゼロ以外のアクティブ化に制限されます。 CNNをイベントドメインで実行するように変換すると、スパース性を活用して、推論に必要なMAC操作の数を迅速に削減できるため、消費電力を削減できます。
イベントドメインに変換できる関数には、畳み込み、点ごとの畳み込み、深さごとの畳み込み、最大プーリング、グローバル平均プーリングなどがあります。
オブジェクト分類の推論に必要なMAC操作(濃い青は非イベントドメインのCNN、水色はイベントドメイン/秋田、緑はさらにアクティビティが正規化されたイベントドメインです)。 (出典:BrainChip)
一例では、4ビット量子化後にAkida開発ボードで実行されているキーワードスポッティングモデルは、推論あたりわずか37 µJ(またはワットあたり1秒あたり27,336推論)を消費しました。予測精度は91.3%で、観測されたパフォーマンスを達成するためにチップを5MHzに減速しました。 (下のグラフを参照)。
センサーにとらわれない
BrainChipのNPUIPとAkidaチップはネットワークタイプに依存せず、ほとんどのセンサーと一緒に使用できます。同じハードウェアで、CNN変換、または嗅覚、味覚、振動/触覚のセンシング用のBrainChipのSNNを使用して画像と音声のデータを処理できます。
NPUは、メッシュネットワークを介して通信する4つのノードにクラスター化されます。各NPUには、パラメーター、アクティベーション、および内部イベントバッファー用の処理と100kBのローカルSRAMが含まれています。 CNNまたはSNNネットワークレイヤーは複数のNPUの組み合わせに割り当てられ、CPUサポートなしでレイヤー間でイベントを渡します。 (CNN以外のネットワークはイベントドメインに変換できますが、Mankarは、Akidaで実行するにはCPUが必要であると述べています。)
BrainChipのNPUIPは最大20ノードに構成でき、より大規模なネットワークは、より少ないノードで設計の複数のパスで実行できます。
4つのBrainChipNPUのノードは、メッシュネットワークで接続されています。 (出典:BrainChip)
BrainChipビデオは、車内システムに配備されたAkidaチップを示し、1つのチップを使用してドライバーを検出し、ドライバーの顔を認識し、同時にドライバーの声を識別しました。キーワードスポッティングには600µW、顔認識には22 mW、ドライバーの検出に使用された視覚的なウェイクワード推論は6〜8mWでした。
BrainChipsのワールドワイドセールス担当バイスプレジデントであるRobTelson氏は、このような自動車プラットフォームの低消費電力は、他の分野の自動車メーカーに柔軟性をもたらし、AkidaチップはTaiwan Semiconductor ManufacturingCo。の28nmプロセス技術に基づいていると付け加えました。 IPの顧客は、より細かいプロセスノードに移動して、より多くの電力を節約できると、Telson氏は付け加えました。
一方、顔認識システムは、クラウドに移行することなく、オンチップで新しい顔を学習できます。スマートドアベルは、たとえば、ワンショット学習からローカルで人の顔を識別することができます。ネットワークの最後の層に十分な数のニューロンが割り当てられている場合、認識される顔の総数は10から50以上に増える可能性があるとMankar氏は述べています。
早期アクセスの顧客
BrainChipには、カリフォルニア州アリソビエホ、フランスのトゥールーズ、インドのハイデラバード、オーストラリアのパースにある本社と設計事務所に55人の従業員がいます。同社は14の特許を取得しており、オーストラリアの証券取引所と米国の店頭取引所で上場しています。
テルソン氏によると、NASAを含む約15人の早期アクセス顧客。その他には、自動車、軍事、航空宇宙、医療(嗅覚Covid-19検出)、家電企業が含まれます。 BrainChipは、スマートヘルス、スマートシティ、スマートホーム、スマート交通機関などの消費者向けアプリケーションを対象としています。
もう1つの初期の顧客は、マイクロコントローラーのスペシャリストであるルネサスです。Telsonによると、IoT展開でのセンサーデータ分析を目的とした将来のMCUと統合するために2ノードのAkida NPUIPのライセンスを取得しています。
AkidaIPとシリコンが利用可能になりました。
>>この記事は、もともと姉妹サイトであるEETimesで公開されました。
>
関連コンテンツ:
- スタートアップは1000個のRISC-VコアをAIアクセラレータチップにパックします
- AIチップは低電力エッジデバイスを対象としています
- AI対応のSoCは複数のビデオストリームを処理します
- 拡張機能を備えたCPU機能を使用してAISoCにセキュリティを構築する
- マイクロコントローラーアーキテクチャはAI向けに進化します
Embeddedの詳細については、Embeddedの週刊メールニュースレターを購読してください。
埋め込み