よりスマートな音声データ処理により、バッテリー寿命が向上します
常に耳を傾けるデバイスにより、音楽の再生、スマートTVの電源のオン、サーモスタットのオフ、さらには誰かが家に侵入したときに警告を発することが非常に簡単になりました。しかし、彼らは私たちにそれらをAC電源に接続するか、非常に頻繁にバッテリーを交換するようにしています。
音声アシスタントが何十年も私たちの生活の中にいるように感じることもありますが、Amazonが最初のスマートスピーカーであるAmazonEchoを発売したのは2014年後半のことでした。 5年後、現在、スマートスピーカー、スマートホームシステム、ウェアラブル、およびウェイクワードを常にリッスンしているその他のスマートデバイスに、何億ものデジタル音声アシスタントがインストールされています。最新の調査から、SAR Insight&Consultingは、2023年までに、常時接続の音声対応デバイスのインストールベースが約10億に跳ね上がると予測しています。
常に聞き取りと音声優先を可能にしたセンサー—鉛筆の先ほどの大きさの超小型微小電気機械システム(MEMS)マイク—は環境音データをキャプチャします。最初は、クラウドでそのデータを処理し、ウェイクワードとコマンドのサウンドを分析することは、優れたソリューションのように見えました。しかし、音声アシスタントやその他の常時接続のIoTデバイスの指数関数的成長により、非常に多くのデータが生成されています。InternationalDataCorp. 1 によると、2025年には416億のIoTデバイスが79.4ゼタバイトのデータを生成します。 —意図しない結果として、総帯域幅に過剰な負担をかけ、コストと電力の非効率性を生み出していること。これにより、半導体業界は、その強力なクラウドコンピューティングの一部をデバイスに導入する新しい方法、つまりエッジ処理と呼ばれる機能を見つけるようになりました。
エッジでの課題
エッジコンピューティングの成功は、低電力デジタルシグナルプロセッサとマイクロコントローラの急速な普及に大きく依存しています。その一部には、組み込みニューラルネットワーク、つまり小さな機械学習(TinyML)チップが含まれています。これらのほとんどがデジタル処理チップは、ウェイクワードが話されたかどうかの判断など、データの複雑な分析をデバイス上で処理できます。しかし、これらのチップは今では頭脳のように賢いかもしれませんが、それでも最初の常時接続のセンシングデバイスで使用された元のシステムアーキテクチャに依存しています。デジタル信号。これは、犬の吠え声や赤ちゃんの泣き声などの音に、目覚めの言葉を含めることができなかった場合でも当てはまります。電力とデータを浪費するこの同じ古い常時リスニングアプローチにより、OEMは消費者の不満と衝突することになります。
消費者は、ポケットや耳の中にさえ収まるが、バッテリー寿命を犠牲にすることなく、これまでになく小型の常時リスニングスマートデバイスに同等以上のパフォーマンスを期待しています。これにより、OEMは困難な状況に置かれます。これは、OEMがレガシーアーキテクチャを維持すると、意味のないデータの処理にバッテリー寿命の80%から90%を浪費し続けるためです。彼らは消費者に2つの悪のうちの小さい方を選ばせることを余儀なくされます:壁に差し込まれなければならない非ポータブル音声アシスタント、またはどこにでも行くことができるが短いバッテリー寿命によって妨げられるポータブル音声アシスタント。
システムを介してデータを移動するには電力がかかるため、電力を節約する最も効率的な方法は、データの量をできるだけ早く重要な量まで減らすことです。常に耳を傾ける力の課題を本当に解決したいのであれば、いつでも人間の感覚システムから来る膨大な量のデータを効率的に処理する脳の能力をより厳密に模倣する新しいパラダイムが必要です。少しだけ力を入れて何が関連しているかを判断し、リソースの大部分を節約して最も重要なデータのみを処理します。
音は当然アナログです
常にリッスンしているデバイスのバッテリー寿命を改善するには、今日のエンジニアの多くが古風で威圧的であると感じるテクノロジーを採用する必要があります。アナログ 。実際の単語からの生の非構造化アナログ信号(つまり、タッチ、ビジョン、聴覚、振動)を操作するのは困難です。最初のデジタル集積回路の導入以来、感知されたアナログデータを直接処理するよりも、使い慣れた1または0でセンサー信号を処理する製品を作成する方がはるかに簡単でした。 (そのため、常時接続のデバイスは、他のほとんどのことを行う前に、アナログ入力をすぐにデジタル信号に変換します。)
デジタルは過去50年間、処理の課題を効果的に解決してきましたが、最終的には物理法則の壁にぶつかった可能性があります。デジタルデバイスのスケーリングが遅くなったため、技術者はデバイス内のチップを工夫するようになりました。この場合、その創造性は2つの根本的な変化によってもたらされました。デジタルをより戦略的に使用するため、デジタルチップは必要な場合にのみ大量の処理を行います。アナログ回路の固有の低電力を機械学習と組み合わせて使用して、音声データが自然なアナログ状態にある間に音声が存在するかどうかを判断する最初の分析を行います。これにより、デジタル処理チップは、キーワードを実際に「リッスン」する必要があるまで、低電力スリープモードに保たれます。
常時接続デバイスの電力効率を高めるための道は、各チップを「脳のように考える」ことではなく、人間の感覚システムに似たシステムアーキテクチャを再考し、音を層ごとに段階的に分析して、ほとんどのエネルギーが集中するようにすることです。最も重要なことについて。
バイオインスパイアードエッジ処理(下)は、デジタル処理能力を最も適切な感覚データに集中させます。 (画像:アスピニティ)
全員が勝ちます
より長いバッテリ寿命を求めることで、システム設計者は、データ処理が少ないほどバッテリ寿命が長くなるという新しいアーキテクチャパラダイムを採用するようになります。エッジ上にあるアナログMLチップは、デジタル処理チップが必要でない限りスリープ状態を維持できるスマートトラフィックマネージャーのように機能します。このバイオインスパイアードの常時オンエッジ処理アプローチにより、アナログおよびデジタルプロセッサは、最も効率的なジョブを実行できるようになり、消費者が最終的な勝者になります。結局のところ、1セットの電池で1年間動作する音声起動テレビのリモコンが欲しくないのは誰ですか?
参照
1 International Data Corp. Worldwide Global DataSphere IoT Device and Data Forecast、2019–2023。 2019年6月
>>この記事はもともと姉妹サイトであるEETimesEurope。
センサー