工業製造
産業用モノのインターネット | 工業材料 | 機器のメンテナンスと修理 | 産業プログラミング |
home  MfgRobots >> 工業製造 >  >> Industrial Internet of Things >> モノのインターネットテクノロジー

音声生体認証ソリューションは認証を対象としています

人工知能の進歩により、音声生体認証の精度が十分に向上し、識別やパーソナライズだけでなく、支払い認証などのアプリケーションにも使用できるようになりました。 SynapticsとIDR&Dの新しいソリューションは、エッジデバイスのSynapticsSoCで実行できるAIを利用した音声生体認証となりすまし防止アルゴリズムを提供します。具体的には、ソフトウェアは、セットトップボックス(STB)、スマートスピーカー、セキュリティシステムなどのスマートホームデバイス向けのSynapticsのVS600シリーズのニューラルプロセッシングユニット(NPU)用に最適化されています。

Synapticsは、AI対応のSoCを、ビデオストリーミング、オーディオストリーミング、およびイメージングを処理する必要のあるスマートホーム製品に販売しています。典型的な使用例は、たとえば、ビデオ会議用のカメラを組み込んだSTBです。


音声生体認証は、スマートホームデバイスでの支払い認証を可能にするのに十分な精度になりました

Synapticsのマーケティング担当バイスプレジデントであるVineetGanjuは、「セットトップボックスアプリケーション全体で共通しており、時間の経過とともに音声をインターフェースとして使用できるようになることです」と語っています。 EE Times 。 「リモコンは音声対応にできるので、リモコンに話しかけてNetflixアカウントをナビゲートしたり、映画を検索したりできます。これらのアプリケーションでは、インターフェースとしての音声がほぼ標準になりつつあります。」

STBがNetflixを実行する場合、ユーザーが最初に行う必要があるのは、使用するプロファイルを選択することです。音声生体認証を使用すると、STBは誰が視聴しているかをすぐに把握し、プロセスから一歩を踏み出すことができます。

「たとえば、ペイパービューコンテンツでは、音声で検索して、サブスクリプションに含まれていない可能性のある特定の映画を見つけることができるだけでなく、視聴するために5ドルを支払う用意があります」とGanju氏は述べています。 「それなら、[オペレーター]はすぐに認証して、その場でその映画を購入してもらいたいと思っています。彼らは、摩擦を大幅に減らし、ユーザーが自分に合わせたコンテンツを見つけるのに役立つだけでなく、そのコンテンツにお金を払って視聴できるようになると考えています。」

デバイスへの登録

ID R&Dの音声生体認証AIは、周波数/ピッチに関連するパラメーターの組み合わせや、発音やアクセントなどの他のものを含む、音声から400を超える特徴を抽出します。

「以前の世代の音声生体認証の一部がそうであったように制限されていません」とIDR&Dの営業担当上級副社長であるJohnAmeinは EE Times に語りました。 、AI音声生体認証が支払い認証などのアプリケーションに必要な精度を達成したのは、昨年かそれだけであると付け加えています。

アルゴリズムは、ユーザーがフレーズを3回繰り返す「登録」と呼ばれるプロセスを通じて、ユーザーの声を認識することを学習します。任意のフレーズを使用でき、すぐに使用できる任意の言語で機能します。登録はエッジデバイスで処理されます。

ID R&DのAIアルゴリズムは、他人受入率が10,000分の1未満の登録ユーザーを識別できます。これは、Ameinが誰かがあなたのPINを推測する確率と比較しています。本人拒否率(登録ユーザーの声が誤って拒否される率)は5%に近い値です。また、システムで再生されるユーザーの音声の録音などのなりすまし攻撃のなりすまし受け入れ率(SAR)は、Androidデバイスの生体認証によるロック解除の標準制限である7%よりも優れています。

「バイオメトリクスのマッチングが10,000分の1の誤った受け入れ率であり、なりすまし防止がAndroid標準で要求される7%の率よりも優れていることの間で、音声バイオメトリクスが受け入れられるために必要な両方のことを実際に達成しています。支払い承認のために十分に安全です」とAmein氏は述べています。

なりすまし防止

ID R&Dのなりすまし防止テクノロジーもAIに依存しています。

「音声の帯域幅は最大3500Hzで、それよりもはるかに高いレートでサンプリングしています」とAmein氏は述べています。 「つまり、私たちは話し声よりも高い周波数を聞いています。さまざまな特性について、これらのより高い範囲で耳を傾けます。」

管状の声道を通して話すことによって生成される人間の声は、スピーカーなどの平らな面の振動によって生成される音とは非常に異なる特徴的な周波数を生成します。これは、なりすまし防止AIが生の声と録音を区別するために使用する要素の1つです。

「テキスト読み上げアプリケーションなど、合成された音声も検出できます」とAmein氏は述べています。 「それらの多くはそれほど素晴らしいものではありませんが、ますますリアルになっています。そして、そのシナリオでは、信号にまだ異常があります。場合によっては完全すぎるか、耳には聞こえない遷移や位相差がありますが、[AI]には聞こえます。」

ニューラルプロセッシングユニット

SynapticsのVS600シリーズSoCは、ニューラルプロセッシングユニット(NPU)を備えています。 SynapticsのVineetGanjuは、VS680のNPUは6.75 TOPSを提供し、新しく発表されたVS640は1 TOPSを提供し、「より主流のコストとパフォーマンスおよびパワーポイント」を目的としています。どちらの部分のNPUにも、ID R&Dの音声生体認証アルゴリズムとなりすまし防止を同時に実行するための「十分すぎる」コンピューティングがあります。 NPUは、使用率が3分の1に削減されたチップのCPUを使用する場合と比較して、音声生体認証の推論を10分の1に高速化することができました。

Synapticsは、ID R&Dなどの企業がNPU向けにテクノロジーを最適化できるようにするツールセットを提供します。また、ID R&Dは、この点でSynapticsの最初のパートナーですが、将来的には、音声生体認証以外のアプリケーションについて、より多くのパートナーと協力する予定です。

>

「音声認識会社との話し合いに基づいて、NPUの1 TOPS機能の範囲内で、デバイス上で完全な英語の語彙音声認識エンジンを実際に実行できます」とGanju氏は述べています。 「したがって、音声認識に関して完全にオフラインの製品を使用できます。たとえば、ユーザーがすぐにWiFiに接続しない製品の場合、オンボードの音声認識は、以前から優れた音声認識を実現するのに役立ちます。接続されています。」

ID R&Dからの最初のソフトウェアビルドは、今月後半にSynapticsのVS600開発キットで利用できるようになります。

>>この記事はもともと姉妹サイトのEETimes。


モノのインターネットテクノロジー

  1. IIoTセンサーからクラウドゲートウェイへのソリューション
  2. 微分方程式
  3. MintermとMaxtermのソリューション
  4. pH測定
  5. 製造モビリティ:データ、音声、ビデオ、場所
  6. インダストリー4.0ソリューションアーキテクトとのQ&A
  7. IoTソリューション開発の3つの課題
  8. Siemens、Bentley Launch Solution to Speed Speed Plant Digitalization
  9. Azima DLIソリューションは、機械の状態監視プログラムを対象としています
  10. CNCマシンでのお客様の声
  11. HMI-PLC統合