工業製造
産業用モノのインターネット | 工業材料 | 機器のメンテナンスと修理 | 産業プログラミング |
home  MfgRobots >> 工業製造 >  >> Industrial Internet of Things >> 埋め込み

ドメイン固有のアクセラレータを使用してRISC-Vアーキテクチャを拡張する

RISC-V市場が最初に始まったとき、最初の急いでいたのは、深く組み込まれたアプリケーションで独自のCPU命令セットアーキテクチャ(ISA)を使用していたはずの設計のコストを削減することでした。これらのシステムオンチップ(SoC)がFinFET半導体プロセス技術で製造され始めたとき、マスクコストが非常に高くなり、多くの有限状態マシンがRISC-V命令セットに基づくプログラム可能なマイクロシーケンサーに置き換えられました。これらは最初の興奮を生み出し、その後、2014年から2018年にかけて単純なRISC-Vコアのコモディティ化を実現しました。

RISC-Vアーキテクチャが成熟し、SoC設計者がISAに精通するにつれて、高性能が要求されるリアルタイムアプリケーションに採用されるようになりました。特に、人工知能などのアプリケーション向けの高度に専門化されたアクセラレーションエンジンのフロントエンドとして機能します。 。この採用の主な理由の1つは、RISC-Vはユーザーが命令を追加できるオープンアーキテクチャであるため、従来のアーキテクチャの場合のように、RISC-VプロセッサがアクセラレータをメモリマップドI / Oデバイスとして扱う必要がなかったことです。 。代わりに、低レイテンシのコプロセッサを使用できます。

ベクトル拡張機能を備えたRISC-Vプロセッサの可用性により、特殊なアクセラレータが、人工知能(AI)、拡張現実/仮想現実(AR / VR)、コンピュータビジョンなどのアプリケーションのカーネルの内部ループ間のレイヤーを処理できるようになりました。ただし、これは、外部アクセラレータから内部ベクトルレジスタにデータを取り込むカスタムロード命令などの専用の拡張機能なしでは不可能です。

このシフトを推進するのは、これらのアプリケーションで要求されるプログラミングモデルです。乗算器の1つの大きな配列である専用アクセラレータは、実行する操作とデータ移動の両方で柔軟性はありませんが、非常に効率的です。これをx86のような汎用プロセッサと比較してください。これにより、プログラマは、コンピューティングエンジンの制約に関係なく、プログラミングに究極の柔軟性を得ることができます。>>

特殊なカスタム命令で拡張されたRISC-Vの標準ベクトル拡張は、アクセラレータの理想的なコンパニオンです(画像:Andes Technology)

明らかな解決策は、汎用CPUの柔軟性と、非常に特定のタスクを処理できるアクセラレーターを組み合わせることです(上の図を参照)。 RISC-Vでは、特殊なカスタム命令で拡張された成熟した標準ベクトル拡張がアクセラレータの理想的なコンパニオンであり、ドメイン固有のアクセラレーション(DSA)ソリューションがRISC-Vプラットフォームに収束するにつれて、この採用は過去18か月で明らかになりました。

このビジョンを可能にするには、アクセラレータがメモリを含む独自のリソースを使用して独自のコマンドセットを実行できる必要があることを確認しました。アクセラレータの実行を合理化するために、RISC-Vは、マイクロコードを必要な幅にフラット化し、必要なすべての制御情報を1つのコマンドでアクセラレータにパックできる必要があります。さらに、このアクセラレータコマンドセットは、RISC-Vプロセッサのスカラーレジスタとベクトルレジスタ、および制御レジスタファイルやメモリなどの独自のリソースを認識している必要があります。

アクセラレータが特別な方法でデータを並べ替えたり操作したりするのに役立つ必要がある場合、アンデスアーキテクチャはこれをベクトル処理ユニット(VPU)で処理して、データの順列の複雑な作業(シフト、収集、圧縮、拡張)を処理します。レイヤーの間に、複雑さを伴ういくつかのカーネルがあります。ここで、VPUはそのニーズに対応するのに役立つ柔軟性を提供します。これらのソケットでは、アクセラレータとVPUの両方が大量の並列計算を実行します。そのため、ハードウェアを追加して、メモリサブシステムの帯域幅を大幅に増やし、計算要求に一致させました。これには、プリフェッチや、順不同のリターンを伴う非ブロッキングトランザクションが含まれますが、これらに限定されません。

最新のV-extension0.8バージョンをサポートするAndesTechnologyの最初のRISC-VベクトルプロセッサであるNX27Vは、8ビット、16ビット、および32ビット整数から16ビットおよび32ビット浮動小数点までの単位で各計算を実行します。また、Bfloat16およびInt4形式をサポートして、機械学習アルゴリズムの重み値のストレージと転送帯域幅を削減します。 RISC-Vベクトル仕様は、設計者がベクトル長、各ベクトルレジスタのビット数、SIMD幅、各サイクルでベクトルエンジンによって処理されるビット数などの主要な設計パラメータを構成できるようにする点で非常に柔軟性があります。

NX27Vのベクトル長は最大512ビットで、最大8つのベクトルレジスタを組み合わせることで4096ビットまで拡張できます。並列パイプラインで動作する複数の機能ユニットを追加することで、多様なアプリケーションで必要とされる計算スループットを維持できます。 512ビットのベクトル長と同じSIMD幅で構成された実装では、0.3 mm 2 の領域内で、最悪の場合の条件下で7nmで1GHzの速度に達します。 。ソフトウェア開発サポートでは、コンパイラ、デバッガ、ベクトルライブラリ、サイクルシミュレータに加えて、NX27Vパイプラインの視覚化ツールであるClarityが、重要なループのパフォーマンスの分析と最適化に役立ちます。このソリューションは、早期アクセスプログラムですでに出荷されています。

過去15か月で、強力なRISC-Vベクトル拡張機能を追加し、それを高帯域幅メモリサブシステムと照合し、アクセラレータをCPUに近づけることで、高性能に対する大きな需要が見られました。これは、RISC-Vおよびベクトル処理の需要を促進すると私たちが信じているタイプのコンピューティング要件です。

>>この記事はもともと姉妹サイトのEETimes。


埋め込み

  1. OpenFogでIICをご紹介します!
  2. 産業用インターネットリファレンスアーキテクチャの第2バージョンがレイヤードデータバスでリリース
  3. IoTで山火事と戦う
  4. 衛星IoTで到達不可能なものに到達する
  5. 適切なRISC-Vカスタム命令を使用してアプリケーションを高速化するためのガイド
  6. ロボット工学で未来を設計する
  7. ヒューズ1をヒューズ1で印刷する
  8. データをどうすればいいですか?!
  9. エッジコンピューティング:未来のアーキテクチャ
  10. IoT脅威ベクトルの保護
  11. IoTのある道