工業製造
産業用モノのインターネット | 工業材料 | 機器のメンテナンスと修理 | 産業プログラミング |
home  MfgRobots >> 工業製造 >  >> Industrial Internet of Things >> モノのインターネットテクノロジー

音声制御のアルゴリズムとハードウェアパワーの上昇

音声制御と音声インターフェイスは、ほとんどすべてのコンシューマーエッジデバイスカテゴリに容赦なく浸透し始めています。音声認識アルゴリズムとAIアクセラレータハードウェアの両方の進歩により、スマートホームデバイス(さらには一部のダムデバイス)など、電力やコストに制約のあるアプリケーションでもテクノロジーにアクセスできるようになりました。

ユーザー側から見たスマートホームデバイスの音声制御の背後にある要因は明らかです。


Alireza Kenarsari-Anhari(出典:PicoVoice)

「現時点では、使いやすさと利便性が主な推進力です」と、PicoVoiceのCEOであるAlirezaKenarsari-AnhariはEETimesに語りました。コーヒーが欲しいときに、デスクからホームオフィスのコーヒーメーカーに向かって叫んだり、濡れた洗濯物のバスケットを持って回転式乾燥機に注文したりすることは簡単に想像できます。

ポータブルではないこのようなスマートデバイスは、家のWiFi接続に永続的にアクセスできると想定しています。クラウドでこの音声処理を行ってみませんか?

この状況でエッジAIに向かう傾向は、主にプライバシーによって推進されています。これは、Kenarsari-Anhariによると、消費者にとっては懸念事項ですが、一部の企業にとっては必須です。信頼性はもう1つの推進要因です。「WiFiが機能していない場合に洗濯機が機能しなくなるのは理にかなっていますか?」彼は言った。

特定の状況では、レイテンシーも重要です。一部のアプリケーションでは、ゲームなどの音声ワークロード処理にリアルタイムの保証が必要です。

クラウドでこの音声データを処理するにはコストがかかるため、コストは音声のエッジ処理のもう1つの大きな要因です。クラウドAPIを使用するたびに支払うというビジネスモデルは、低コストで毎日何度も使用される可能性のある家電製品や家電製品などのユースケースでは機能しません。

1ドル未満のマイクロコントローラーでクラウドから独立して実行するように設計されたAI音声テキスト推論エンジンであるPicoVoiceは、他の方法では実現できないアプリケーションで音声制御を可能にすることを目的としています。これには、マイクロコントローラーベースの音声ソリューションによって実現できる電力効率とコスト効率を必要とするクロスポイントにある消費者向けウェアラブルとヒアラブルが含まれる可能性があります。電力とコストを最適化したソリューションは、産業、セキュリティ、医療アプリケーションの機会を開拓する可能性もあると、Kenarsari-Anhari氏は述べています。

同社は最近、マイクロコントローラー上で音声アプリケーションを構築するためのノーコードプラットフォームであるShepherdを立ち上げました。これは、同社のモデル作成ソフトウェアであるPicoVoiceConsoleと連携します。 Shepherdは、STおよびNXPの人気のあるArm Cortex-Mマイクロコントローラーをサポートし、途中で他のデバイスをサポートします。

「私は音声をインターフェースと考えています。コーディングせずにGUIやWebサイトを構築できれば、おそらくWordPressを使用して、同様の方法で音声インターフェースを構築することが次の論理的なステップです」とKenarsari-Anhari氏は述べています。 「シェパードは、プロダクトマネージャーとUXデザイナーがプロトタイプを作成し、高速に反復できるように支援していますが、ターゲットユーザーベースを拡大することを目指しています。誰もが自分のアシスタントを作成できるとしたらどうでしょうか。 Alexaではなく、好きな名前を付けてください。 —そして彼らが望む個性をそれに与えます。」

自然言語処理モデルを開発し、専門のソフトウェアなしでそれらを実装することは完全に可能ですが、このルートはすべての人に適しているわけではありません。

「確かにできること—アップル、アマゾン、グーグル、マイクロソフトがやった」と彼は言った。 「それは本当に、企業がリソースを持っているかどうか、その周りに組織を構築することにコミットしているかどうか、そして数年待つ余裕があるかどうかについてです。」

将来のトレンド

SyntiantのCEOであるKurtBusch氏は、昨年夏のインタビューでEE Timesに語ったところによると、音声は次世代のテクノロジーユーザーに好まれるインターフェースになりつつあります。


カートブッシュ(出典:Syntiant)

ブッシュは、読むことはできたが、書くことも綴ることもまだ少し若かった彼の末っ子が、スマートフォンの音声インターフェースを使用して友達とテキストメッセージを送る方法を説明しました。

「彼の年上の兄弟のテキストメッセージですが、彼の世代は彼らよりも数年早く電話を手に入れました」とブッシュは言いました。 「時が経つにつれ、彼の世代以下の世代にとって、彼らのデフォルトのインターフェースはそれに話しかけることです。」

ブッシュの見解では、音声は「未来のタッチスクリーン」になり、デバイス内処理により、最初はキーボードまたはマウスを備えたデバイスで、次に白物家電で迅速で応答性の高いインターフェースが提供されます。

Syntiantのチップは、低電力バジェットから非常に低電力バジェットの家電製品で音声AIワークロードを処理するように設計された特殊なAIアクセラレータです。このスタートアップはこれまでに世界中で1,000万を超えるチップを出荷しており、そのほとんどは携帯電話に組み込まれており、常時オンのキーワード検出が可能です。最新のSyntiantチップであるNDP120は、「OK Google」などのホットな単語を認識して、280 µW未満でGoogleアシスタントをアクティブ化できます。

将来的には、ブッシュは音声制御によってすべての人がテクノロジーに接続してアクセスできるようになると考えています。

「私たちは、音声をテクノロジーの優れた民主主義者と見なしています」とブッシュ氏は述べています。 「世界には1日2ドルで暮らす30億人の人々がいます。私の想定では、これらの人々はインターネットにアクセスできず、教育システムを利用していない可能性があります。ここでの自然なインターフェースは[音声]です。これが、今日テクノロジーと相互作用していない世界の3分の1にテクノロジーを導入する方法です。費用の観点だけでなく、快適さの観点からも、これまでアクセスできなかった可能性のある社会のセグメントを取得するために、音声優先アプリケーションについて開発途上国に多くの関心が寄せられています。」

市場の断片化

音声と同じくらい急速に成長している市場の危険性は、市場が急速に細分化される可能性があることです、とKnowlesのIoTのシニアディレクターであるVikram Shirastavaは、ハードウェアラインだけでなく、EETimesに語りました。


Vikram Shrivastava(出典:Knowles)

「たとえば、どの音声認識エンジンが使用されているかに基づいて、市場は細分化されますか?」 Shirastavaは言った。 「TVSoCと統合するのか、それとも電子レンジなどの単純なMCUであるのかによって、市場は細分化されます。オペレーティングシステムに基づいて、または音響環境に基づいて断片化が発生します–それは単なる家ですか?外の呼び鈴ですか?万能のソリューションはあり得ません。これらの各業種に共通する分母が何であるかを見つけ、それに応じて音声の統合に取り組む必要があります。」

KnowlesにはDSPベースの音声制御ソリューションがあり、さまざまな業種向けのバージョンを導入する予定です。そのアプローチは、市場の断片を共通の分母を持つものにグループ化することです。たとえば、ホームコントロール、TVサウンドバー、リモコンは同じグループに分類される可能性があります。次に、そのグループのアプリケーションに最適化されたソリューションを開発します。 Shirastavaは、このアプローチを「ターンキーの1レベル下」と呼んでいます。これにより、ターンキーのスケーラビリティが提供されますが、柔軟性がいくらか追加されます。

「私たちが追求したい分野をカバーできるようにするには、その断片化の特定の側面に対処するいくつかの異なるリリースが必要です」と彼は言いました。

Knowlesの最近のリリースであるAISonicBluetooth Standard Solutionは、スマートスピーカー、スマートホームデバイス、ウェアラブル、車載音声アシスタントなどのBluetooth接続デバイスでの音声認識用の開発キットです。このキットは、KnowlesのIA8201デュアルコアDSPシリコンに基づいています。これは、アプリケーションプロセッサよりもはるかに低い電力でニューラルネットワーク処理用に特別に設計されています。たとえば、このチップは、キーワードスポッティング、ソース分類、ビームフォーミング、音響エコーキャンセレーション(AEC)、およびソース方向推定のための個別のAIモデルを50mW未満で同時に処理できます。これは、テンシリカDSPコアでのオーディオおよびAI処理用の約400のカスタム命令の命令セット拡張によって可能になります。これにより、電力を節約するためにクロック周波数を下げることができます。


SugrのiOttieAivo Connect車両スマートフォンホルダーは、車内音声機能にKnowlesのIA8201を使用しています。 Alexa音声アシスタント機能が組み込まれています。 (出典:Knowles)

音声は、最終的にほとんどのクラスの家電製品のデフォルトのユーザーインターフェイスになりますか?それは確かにそのように見えます。高度で効率的なAI音声制御アルゴリズム、開発者が音声を簡単に統合できる開発環境、エネルギー効率とコスト効率の高いハードウェアソリューションのエコシステムの組み合わせにより、すべてが可能になりました。

>>この記事は、もともと姉妹サイトEEで公開されました。タイムズ。


モノのインターネットテクノロジー

  1. 許容回路とインターロック回路
  2. 特別な変圧器とアプリケーション
  3. 抵抗性および反応性AC回路の電力
  4. 真の、反応性の、そして見かけの力
  5. 製造モビリティ:データ、音声、ビデオ、場所
  6. 5GおよびGaN:将来のイノベーション
  7. ラズベリーパイセンサーとアクチュエーター制御
  8. スマートな地方のビジネスと消費者の台頭
  9. 製造業におけるデジタルツインの力と落とし穴
  10. 電気制御盤の基本
  11. 電力および HVAC/気候制御