工業製造
産業用モノのインターネット | 工業材料 | 機器のメンテナンスと修理 | 産業プログラミング |
home  MfgRobots >> 工業製造 >  >> Industrial materials >> ナノマテリアル

顔認識アプリケーション用のReS2チャージトラッピングシナプスデバイス

要約

よりスマートで効率的なシステムに対する高まる需要を満たすには、シナプスデバイスが必要です。この作業では、異方性二硫化レニウム(ReS 2 )は、シナプスデバイスを構築し、長期増強/抑うつ行動をうまくエミュレートするためのチャネル材料として使用されます。私たちのデバイスが大規模なニューラルネットワークシステムで使用できることを示すために、エールフェイスデータベースから165枚の画像が評価に選択され、そのうち120枚が人工ニューラルネットワーク(ANN)トレーニングに使用され、残りの45枚が使用されますANNテスト用。 10 5 を超える3層ANN 顔認識タスク用に重みが提案されます。また、十分に訓練されたANNの重みを置き換えるために、120の連続変調コンダクタンス状態が選択されています。結果は、わずか120のコンダクタンス状態で100%の優れた認識率が達成されることを示しています。これは、人工ニューラルネットワーク分野でのデバイスの高い可能性を証明しています。

背景

現代のコンピュータの出現以来、算術演算装置がメモリから分離されているフォンノイマン構造が広く使用されてきました。このような構造では、演算装置とメモリ間のデータ転送がボトルネックになり、コンピュータのパフォーマンスの向上が大幅に制限されます[1、2]。一方、演算装置とメインメモリはどちらもエネルギー消費量の多い揮発性デバイスであり、電源を切るとすぐに情報が消えてしまいます[3]。対照的に、人間の脳は、フォールトトレランスが高く、消費電力が少ない(約20 W)効率的な情報ストレージおよびコンピューティングシステムであり、高度に相互接続され、超並列で、構造的に変化する複雑なネットワークに基づいています。 sup> 11 ニューロンと10 15 シナプス[4、5]。これらのニューロンは脳の計算エンジンであると考えられており、何千ものシナプスから入力信号を並行して受信します。シナプス可塑性は、シナプス活動を通じてシナプスの重みを変化させる生物学的プロセスであり、学習と記憶の源と見なされています[6]。

グラフェン、遷移金属ジカルコゲナイド(TMDC)、黒リンなど、サイズが小さく、電子特性に優れた2次元(2D)材料が大きな注目を集め、シナプスデバイスへの実装に成功しています[7、8]。 MoS 2 などの対称格子を持つTMDC およびWSe 2 、広く研究されています[9、10]。一方、二硫化レニウム(ReS 2 )歪んだ八面体(1T)結晶構造を持つものは、ニューロモルフィック分野ではめったに探索されていません。ほとんどのTMDは、単分子層に直接バンドギャップがあり、多層膜に間接バンドギャップがあるため、良好なデバイス性能を得るには、入手が困難な単分子層材料が必要です。ただし、ReS 2 10層以内はすべて直接バンドギャップがあると見なされます[11]。これはReS 2 を意味します。 10層以内ですべてうまく機能します。その上、非対称の格子構造はより弱い層間結合エネルギーをもたらし、それは剥離作業に利益をもたらし、したがってシナプスデバイスの製造をはるかに容易にします[12、13、14、15]。この研究では、ReS 2 チャンネル素材としてフィルムを使用しています。単分子層ReS 2 の結晶構造 図1aに、方向 a を示します。 および b 基底面の2番目に短い軸と最も短い軸をそれぞれ示します。以前の科学的研究と、剥離したReS 2 の多くの光学画像に基づいています 映画[13]、監督 b は、電子移動度が最も高い結晶学的配向を示します。 ReS 2 の電気的特性を説明するため シナプスデバイスの改善、方向 b 図1bに示すように、チャネル電流の方向と見なされます。

ReS 2 に基づくシナプスデバイス 2D素材。 a 単分子層ReS 2 の結晶構造 。 b 5層ReS 2 の光学画像 フレーク。挿入図:ReS 2 にパターン化されたソース電極とドレイン電極 フレーク;方向 b チャネル電流の方向として取られます。 c ReS 2 のAFM画像と高さプロファイル フレーク。 d 2D材料の概略図ReS 2 シナプスデバイス。 Al 2 の厚さ O 3 、ZrO 2 、およびAl 2 O 3 スタック(下から)は、それぞれ12 nm、4 nm、4nmです

短期可塑性(STP)、長期増強(LTP)、長期抑制(LTD)など、シナプスのダイナミクスをうまくシミュレートするさまざまな構造を持つ多くのデバイスがあります[16、17、18]。 MoS 2 / PTCDAハイブリッドヘテロ接合シナプスは、効率的な光電二重変調で実証されています[10]。カーボンナノチューブシナプス[19]とシリコンベースのMoS 2 シナプス[20]は動的論理を示しました。ただし、言及された研究はシナプスレベルにのみ焦点を当てていました。いくつかの研究では、デバイスを使用して人工ニューラルネットワーク(ANN)を構築できることを証明するために、さまざまなコンダクタンス状態が実現されましたが、計算のために導電状態をANNに入れませんでした[21、22]。この作業では、120の連続コンダクタンス状態が変調され、対応するコンダクタンス値が計算のためにトレーニングされた顔認識ネットワークで使用されます。 100%という優れた認識率が達成されています。

メソッド

シナプスデバイスの概略構造を図1dに示します。ここでは、70 nmのITO(インジウムスズ酸化物)膜がSiO 2 上に堆積していることがわかります。 バックゲート電極としての/ Si基板。基板は200nmのSiO 2 を含むSiウェーハでした。 上に。最初にアセトン、イソプロピルアルコール、脱イオン水で洗浄し、次にN 2 で乾燥させました。 ITO堆積前のガス。 ITO層は、最初にスパッタリングによって堆積され、次にN 2 内で400°Cでアニールされました。 ラピッドサーマルプロセッシング(RTP)による10分間の雰囲気。電子ビームリソグラフィーを使用してソース電極とドレイン電極を正確に製造するために、透明なITO電極が使用されます。 Al 2 O 3 / ZrO 2 / Al 2 O 3 厚さ12nm、4 nm、および4 nmのサンドイッチ構造は、それぞれバリア層、電子捕獲層、およびトンネル層としての原子層堆積(ALD)によってITO上に成長しました。次に、機械的に剥離されたReS 2 パターン化されたTi / Au電極の下に、チャネルとして約3.6nmの厚さのフレークが堆積されました。厚さ10nmおよび70nmのTi / Au電極は、電子ビームリソグラフィーとそれに続くソースおよびドレインとしての電子ビーム蒸着をそれぞれ使用してパターン化されました。図1cは、厚さ3.6nmのReS 2 の原子間力顕微鏡画像を示しています。 フィルム(約5層);チャネル長は1.5μmになるように設計されています(図1bの挿入図を参照)。この作業では、ITOバックゲートがシナプス前ニューロンとして機能し、Ti / Au電極がシナプス後ニューロンとして機能しました。ソース電極とドレイン電極の間に小さく一定の電圧を印加し、ITOバックゲート電極にパルスを印加してシナプスデバイスの性能を調整しました。

結果と考察

図2aは、2 Vのバックゲート電圧( V )でのシナプスデバイスの伝達特性を示しています。 bg =2 V)固定のドレイン-ソース間電圧( V ds )100mVのステップで100から700mVに変更します。 10 6 を超えるオン/オフ電流比 観察できた。曲線は、ドレインからソースへの電流( I ds )、最初は急速に増加し、次に飽和状態になりました。優れた飽和特性は、ITOバックゲート電極による強力なチャネルレギュレーションに対応していました。ボトムゲート電極としてシリコンを使用し、SiO 2 を使用する従来のトランジスタとは異なります。 通常20Vを超える動作電圧での誘電体として[23]、ReS 2 間の距離がわずか20nmのシナプスデバイスの動作電圧 チャネルとITOバックゲート電極は5V未満であり、シナプスデバイスの効率が大幅に向上しました。図2aの挿入図は、低 V での超線形関係を示しています。 ds ReS 2 間の良好なショットキー接触を示すレジーム チャネルおよびソース電極とドレイン電極。図2bに示すように、 I ds V bg V の場合、ヒステリシス曲線が観察されます。 bg −5から5Vに変更された後、0.1 V( V )の一定のバイアスで反転しました。 ds =0.1 V)。測定では、0.1 Vの小さな定電圧をソース電極とドレイン電極の間に印加して、シナプス後電流を「読み取り」ました。シナプス性能の基礎を提供するメモリウィンドウは約3.5Vでした。このような大きなメモリウィンドウにより、ReS 2 シナプスアプリケーションに非常に有望なデバイス[24]。 ZrO 2 の価電子帯の頂点から Al 2 よりも高かった O 3 、伝導帯の底はAl 2 の底よりも低かった。 O 3 (図2cの挿入図を参照)、ZrO 2 アルミナに挟まれた中間層として使用すると、電荷を効果的に捕捉できます。正および負のバックゲート電圧下のエネルギーバンド図をそれぞれ図2cおよびdに示します。正の電圧が印加されると、ReS 2 の電子 チャネルは最初にAl 2 をトンネリングします O 3 トンネリングレイヤー、ZrO 2 によってキャプチャされます トラッピング層。逆に、ITOに負の電圧を印加すると、電子がZrO 2 に集まります。 レイヤーはReS 2 に送信されます チャネル;エネルギーバンドはチャネルの方向に曲がっています。

ReS 2 の電気的特性 シナプスデバイス。 a 伝達特性( I ds V bg )ReS 2 の 固定された V のシナプスデバイス ds 100mVのステップで100から700mVに変化します。 b 出力特性( I ds V ds )ReS 2 の 固定された V のシナプスデバイス bg 1V刻みで-2Vから2Vに変化します。 c V でのヒステリシスループ bg ±5Vの掃引範囲。 V ds 100mVに保たれました。 d ReS 2 のエネルギーバンド図 正のバックゲート電圧を持つシナプスデバイス。挿入図:Al 2 のエネルギーレベル O 3 およびZrO 2 e ReS 2 のエネルギーバンド図 負のバックゲート電圧を持つシナプスデバイス

図3aでは、ITOバックゲートで負の入力パルス(振幅-1 V、持続時間10 ms)を印加した後、典型的な興奮性シナプス後電流(EPSC)が検出されました。また、正の電圧パルス(振幅1 V、持続時間10 ms)に応答する抑制性シナプス後部が図3bで観察されました。これは、生物学的シナプスと同様です[25]。シナプス前ニューロンからのパルス信号は、シナプスを介してシナプス後ニューロンに伝達され、シナプス後電流(PSC)に変換されました[26]。 PSC値は、パルスの振幅と持続時間によって決定されました。パルスが負の場合、ZrO 2 の欠陥からの電子 上部のAl 2 を通り抜けるのに十分なエネルギーを得た O 3 ReS 2 への誘電体層 チャネル。電流の一定値は前の値よりわずかに高く(ΔPSC=0.04 nA)、長期間維持することができました。この現象は、生物学的シナプスの長期増強(LTP)に対応していました。ただし、パルスが正の場合、ReS 2 の電子 Al 2 を介してトンネリングされたチャネル O 3 電場の引力の下にある層であり、ZrO 2 の欠陥によって捕捉されました 。したがって、電流の一定値は元の値よりもわずかに低く、長期間同じ状態を維持することができました(ΔPSC=0.06 nA)。このプロセスは、生物学的シナプスの長期うつ病(LTD)に対応していました。 LTPとLTDは、シナプスデバイスの学習と記憶のための生理学的基盤を提供しました。図3cに示すように、振幅が-2 V、持続時間が10 msの負のパルスをパルス間に1秒間隔で連続的に印加すると、2つのステップで電流の上昇が観察されました。上昇電流値はそれぞれ1.6nAと1.4nAでした。したがって、図3dに示すように、周期的なゲート電圧パルスの下で連続的かつ均一に上昇する電流を得ることができ、刺激後の定常電流は長時間続く可能性があります。この発見は、複数の安定した導電状態を取得するための基礎を提供しました。

ReS 2 のシナプス性能 シナプスデバイス。 a 入力パルス(-1 V、10ms)によって引き起こされる興奮性シナプス後電流(EPSC)。 b シナプス前スパイク(1 V、10 ms)によって引き起こされる抑制性シナプス後電流(IPSC)。 c 2つの連続する入力パルス(-2 V、10 ms、パルス間の間隔が1秒)によってトリガーされるEPSCの出力スパイクのペア。 d ReS 2 の保持特性 − 3Vおよび10msのシナプス前スパイク後のシナプスデバイス

図4aは、振幅が-2 V、持続時間が10 ms、パルス間隔が1秒の負のパルスを120回印加した後の120の電流値を示しています。明らかに、電流曲線は優れた直線性を示し、各状態で120の有効な高安定コンダクタンス状態が得られました。異なるコンダクタンス状態は、異なるANN重み値に対応しました[27]。

顔認識のための人工ニューラルネットワーク。 a 120個の負のパルスを印加した後の120個のコンダクタンス状態(-2 V、10 ms、パルス間に1秒の間隔)。 b 1024個の入力ニューロン、256個の隠れニューロン、および15個の出力ニューロンを備えた3層ANN。 c トレーニング-認識サイクルのフローチャート

この作業では、顔認識タスク用の3層人工ニューラルネットワークを提案し、その構造を図4bに示します。ここで、入力層は、画像の1024ピクセルに対応する1024個のニューロンで構成されていることがわかります。中間(非表示)層は256個のニューロンで構成され、出力層は15個のクラスの顔に対応する15個のニューロンで構成されます。

提案されたANNの開発は次のとおりです。 Yale Faceデータベース[28]の15種類の写真を含む、合計165枚の写真が、ANNのトレーニングとテストに使用されます。各タイプの8つの画像がANNトレーニングに使用され、各種類の残りの3つの画像がANNテストに使用されます。モジュールが入力と内部の重みに対して滑らかな関数であることを考えると、多層アーキテクチャは単純な確率的勾配降下法によってトレーニングでき、勾配は一般にバックプロパゲーション手順によって計算されます[29]。したがって、従来の後方伝搬(BP)アルゴリズムを使用してネットワークを構築し、BPアルゴリズムがANNに対してどのように機能するかを示します。

この作品では、 X m は入力ニューロンを表すため、隠れニューロンの入力値は次のように表すことができます。

$$ {Y} _ {in} =\ sum \ Limits_ {m =1} ^ {1024} {X} _m {V} _ {mn} $$

ここで、 V mn 入力ニューロン X 間の重み値を表します m と隠されたニューロン Y in 、およびすべての V mn 合計1024×256の重み値を持つ行列Vを形成します。この行列の初期値はランダムに割り当てられます。隠れ層の活性化関数はシグモイド関数であるため、隠れニューロンの出力値は次の式で与えられます。

$$ {Y} _ {on} =\ frac {1} {1+ {e} ^ {Y_ {in}}} $$

したがって、出力ニューロンの入力値は次のように表すことができます。

$$ {Z} _ {ik} =\ sum \ Limits_ {n =1} ^ {256} {Y} _ {on} {W} _ {nk} $$

ここで W nk 隠れニューロン Y 間の重み値を表します オン および出力ニューロン Z ik 、およびすべての W nk 合計256×15の重み値を持つ行列Wを形成します。 W の初期値 nk また、ランダムに割り当てられます。さらに、出力層の活性化関数としてシグモイド関数を使用するため、出力ニューロンの出力値は次のようになります。

$$ {Z} _ {ok} =\ frac {1} {1+ {e} ^ {Z_ {ik}}} $$

上記で計算した出力を正しい出力と比較すると、合計出力誤差が得られ、次のように表されます。

$$ E =\ frac {1} {2} \ sum \ Limits_ {k =1} ^ {15} {\ left({O} _k- {Z} _k \ right)} ^ 2 $$

ここで、 O k は正しい出力値です。これまで、ネットワークの順方向伝搬プロセスについて完全に説明してきました。認識率を向上させるには、重みの誤差を計算するためのバックプロパゲーションプロセスが必要であり、次の反復でネットワークの重みを更新するために使用されます。

$$ \ Delta {V} _ {mn} =\ mu \ frac {\ partial E} {\ partial {V} _ {mn}} $$$$ \ Delta {W} _ {nk} =\ mu \ frac {\ partial E} {\ partial {W} _ {nk}} $$$$ {V_ {mn}} ^ {\ prime} ={V} _ {mn} + \ Delta {V} _ {mn} $ $$$ {W_ {nk}} ^ {\ prime} ={W} _ {nk} + \ Delta {W} _ {nk} $$

上記の数式では、 ∆V mn および ∆W nk それぞれ V のエラーを表します mn および W nk ;元の重みにエラーを追加した後、更新された重み V を取得します。 mn ' および W nk ' ; μ は学習率であり、μ =0.06。重みを更新した後、新しい画像がANNに送られ、120枚の画像すべてがトレーニングに使用されるまで、重みの更新プロセスが繰り返されます。次に、トレーニングされたネットワークを使用して、残りの45枚の画像を識別し、認識率を計算します。 ANNテストプロセスには、順方向伝搬プロセスのみが必要です。テストに使用される各画像は、順方向伝搬後に15個の出力値を取得します。出力値は、入力画像が特定のタイプである確率を反映しています。最大確率値の出力が選択され、対応するタイプはネットワークによって識別された入力画像のタイプです。認識結果は標準出力と比較されます。正しく識別されたすべての写真がカウントされ、それらの総数は n です。 。各トレーニング-認識サイクルで、認識率 r によって与えられます:

$$ r =\ frac {n} {45} \ times 100 \%$$

一般に、最初の認識の認識率は非常に低く、256個の隠れニューロンを持つANNでは、最初の認識率はわずか17.78%です。上記のトレーニング-認識プロセスは、最大認識率が得られるまで繰り返されます。トレーニングと認識のサイクル全体を図4cに示します。

図5aに示すように、ANN開発プロセス中、最大認識率と認識率の上昇速度(トレーニング速度)は、隠れニューロンの数が異なると異なりました。隠れニューロンの数が多いほど、最大認識率が高くなり、立ち上がり速度が速くなりますが、エネルギー消費量も増えるため、特定のトレードオフを行う必要があります。図5bに示すように、256個の隠れニューロンの場合、600回のトレーニング後に認識率は100%に達しました。これは間違いなく達成可能な最大認識率であったため、ANNでは隠れニューロンの数を256に設定しました。さまざまなトレーニングテストサイクル後の重み値の分布を図5cに示します。これは、より多くのサイクルの後、重みはより分散しました。つまり、より高い認識率に到達するには、ANNの重みを調整する必要がありました。最大認識率を達成すると、行列 V および W 最適な重量値を有するものが得られた。 ReS 2 デバイスはANNに適用するのに適しており、重み行列のすべての重み値 V および W デバイスのコンダクタンス値に置き換えられました。 I を使用しました j j =1、2、3⋯120)は、120サイクル後に取得された120のコンダクタンス値を表し、コンダクタンス範囲が次の式で与えられる重み範囲と一致するように、元のコンダクタンス値を線形変換しました。

$$ {C} _j =A {I} _j + B $$

顔認識の実現。 a 異なる数の隠れニューロン(32、64、128、および256)での認識率曲線。 b 256個の隠れニューロンでの認識率曲線。約600回のトレーニングテストエポックの後、認識率は100%に達します。 c 10〜90(20刻み)のトレーニングエポック後の重み値の分布。 d 100から600(100刻み)のトレーニングエポック後の重み値の分布。 e 交換後の認識率;重み値は、100〜500トレーニングエポック(100刻み)後に置き換えられました

ここで C j 線形変換後の重み値を表します。 600サイクルの場合、線形変換係数は A でした。 =1.3769×10 10 および B =−65.784。次に、各 C を減算しました j 各重み値から、重み値を C に置き換えました j 減算後の絶対値が最小でした。つまり、min | V を計算しました mn C j |、分| W nk C j |各重み値を対応する C に置き換えました j 。このようにして、新しい V を取得しました。 および W すべての重み値が C に置き換えられた重み行列 n 。次に、ANNテストで新しい重み行列を使用し、100%のANN認識率が達成されました。これにより、120のコンダクタンス状態をANNの重み値として完全に使用できることが証明されました。さらに分析するために、100〜500トレーニングサイクル(100刻み)後に重み値を置き換えました。図5dに示すように、置き換え後に得られた識別結果は元の結果と完全に一致しています。これは、これらの120の現在の値が10 5 を完全に置き換えることができることを証明しています。 計算用の重み値。ゲートパルスの数をさらに増やすことにより、より多くのコンダクタンス状態を得ることができ、ReS 2 デバイスは、大規模なニューラルネットワークシステムで使用できます。

結論

この作業では、high-k誘電体スタックベースの2D ReS 2 を紹介します。 シナプスデバイスであり、長期増強や長期抑制などのいくつかの基本的なシナプス行動を示します。結果は、ReS 2 デバイスはシナプスのパフォーマンスをうまくシミュレートできます。また、人工ニューラルネットワークにおける提案されたデバイスの適用を証明するためにANNが構築されます。 120個の周期的なゲート電圧パルスを印加すると、120個の効果的で明確に区別されたコンダクタンス状態が得られ、10 5 以上の代わりに使用されます。 顔認識のためのANNの重み。交換後、100%の認識率を達成しています。この優れた結果は、ReS 2 シナプスは、人工ニューラルネットワークを構築するために使用できます。

データと資料の可用性

著者は、資料、データ、および関連するプロトコルが読者に利用可能であり、分析に使用されるすべてのデータがこの記事に含まれていることを宣言します。

略語

2D:

二次元

ALD:

原子層堆積

ANN:

人工ニューラルネットワーク

LTD:

長期的なうつ病

LTP:

長期増強


ナノマテリアル

  1. 医療用マイクロタンタル粉末
  2. アプリケーションスポットライト:医療用インプラントの3D印刷
  3. アプリケーションスポットライト:自転車製造のための3D印刷
  4. アプリケーションスポットライト:ベアリングの3D印刷
  5. アプリケーションスポットライト:熱交換器用の3D印刷
  6. アプリケーションスポットライト:履物の3Dプリント
  7. アプリケーションスポットライト:タービン部品の3D印刷
  8. アプリケーションスポットライト:航空機キャビンの3D印刷
  9. アプリケーションスポットライト:ロボットグリッパーの3D印刷
  10. DHT Tiny Breakout for the Raspberry Pi
  11. リアルタイムの顔認識:エンドツーエンドのプロジェクト