工業製造
産業用モノのインターネット | 工業材料 | 機器のメンテナンスと修理 | 産業プログラミング |
home  MfgRobots >> 工業製造 >  >> Industrial Internet of Things >> センサー

自動運転モデル​​は厳しい交通問題をナビゲートします:狭い通り

2台の車両が一方通行の道路を互いに向かい合っているとしましょう。

このようなタイトでやりがいのある運転シナリオでハンドルを握っている場合は、近くの関係者と交渉することができます。道路の脇に引っ張ってから、前方のドライバーが細い車線を引っ張るように動きます。相互作用を通じて、すべての人を安全に、目的地に向かわせるための操作を見つけることができます。

自動運転車はより困難な課題を抱えており、近くのドライバーと彼らの素晴らしいプレーへの意欲を何らかの形で理解する必要があります。

開発中の新しいアルゴリズムは、混雑した狭い通りの厳しい交通を自動運転車に誘導することができます。

カーネギーメロン大学アルゴAI自動運転車研究センターの研究者によって構築されたアルゴリズム は、さまざまなレベルのドライバーの協調性をモデル化することによって決定を下します。つまり、ドライバーが別のドライバーを通過させるために車を停める可能性がどの程度あるかをモデル化します。

「マルチエージェント強化学習」(MARL)により、研究者のクリストフキリングが率いるチームは、自動運転車に、これまでのシミュレーションで、防御的な運転や他のエージェントの行動の解釈など、人間のような行動を示すようになりました。

このアルゴリズムは実際の車両では使用されていませんが、モデルの報酬ベースのシステムのおかげで、結果は有望です。

「私たちは安全を念頭に置いて相互作用を奨励しています」と、コンピュータサイエンス学部のロボティクス研究所の元客員研究員であるキリングは述べています。 現在はミュンヘン工科大学の自律空中システムラボの一部です。

Tech Briefs との短いQ&A 以下では、クリストフが、彼のチームのインセンティブベースのモデルが、道路の公式ルールがない厳しい交通状況をどのようにナビゲートするかについて詳しく説明します。

テクニカルブリーフ: 両方を少し必要とする課題をナビゲートするときに、モデルをより協力的または攻撃的として特徴付けますか?

クリストフキリング: 他の運転シナリオと同様に、自動運転車は安全を最優先し、すべての交通規則に従う必要があります。ただし、これが考慮されるシナリオの美しさと課題です。この種のシナリオには、調整する交通ルールはありません(たとえば、4方向の交差点とは対照的です)。同等の通行権を持つ2台の車両は、基本的に誰が最初に行き、誰が待つかを交渉する必要があります。

両方の車両が純粋に安全性に焦点を合わせている場合、それらは両方とも引っ張られます。私たちの研究で直面した主な課題は、1台の車両をプルオーバーさせ、1台を移動させる方法でした。調整するインスタンスなしでそれぞれが独自の決定を行う場合、両方の車両をプルオーバーさせたり、移動させたりしないでください。

安全を念頭に置いて相互作用を奨励します。スピードでクラッシュすることはタイムアウトよりも悪いですが、タイムアウトはまた、エージェントが相互作用し、すれ違うことを学ぶように動機付けるための小さなペナルティをもたらします。

技術概要 :モデルがドライブを実行するために使用している主なパラメータは何ですか?アルゴリズムはその決定の基礎となる基準は何ですか?

クリストフキリング :私たちのアルゴリズムは、実際の車で何が利用できるかを認識します。車の前部周辺の距離と相対速度の測定値があります(ここのレポートの図2を参照 )。特に、関連する作業と比較して、シナリオでは鳥瞰図を使用せず、自己中心的な視点を使用します。これにより、死角ができたため、少し注意が必要になります。この観察結果は、エージェントにどの程度攻撃的に行動するかを伝えるための上記の協調性などの追加のパラメーターによって強化されますが、現在のステアリング角度とスロットル位置(このシナリオで自分を運転するときにもわかります)。

>

技術概要 :アルゴリズムを正しく実行するためにまだ難しいことは何ですか?

クリストフキリング :主な課題は2つあります。過度にアグレッシブなペアリングと過度にパッシブなペアリングです。 (ここで視覚化を比較してください 。)特に、私たちのポリシーはほとんどの場合シナリオを交渉することができます。それでも、人間の乗客は、ここに示されている操作の一部を自分の車が行っていることにかなり不満を持っている可能性があります

技術概要 :敵のドライバーが積極的に「悪い」ドライバーであることが明らかな場合、アルゴリズムは何をしますか?または、過度に「協力的な」ドライバーですか?

クリストフキリング :各車両に協調性の値を割り当て、行動がどれほど積極的であるかを伝えることで、運転ポリシーをテストします。それぞれが自分の協調性についてのみ知っており、対向車の1台については知りません。これらの協調性の値は、非常に単純な方法での運転行動に変換されます。非協調的なドライバーは、自分の進歩にのみ関心があります。非常に協力的なドライバーは、誰かが行く限り、どの車両が最初に前進するかを気にしません。これらの値は、インタラクション全体で固定されています。

(「気性を失う」ことは考慮していません。ここでは詳しく説明しませんが、「数学的な理由で」そのままにしておきましょう。)

技術概要 :モデルの一部で、相手のドライバーの一種の「読み取り」が必要ですか?

クリストフキリング :「読む」についての一言:ロボット工学では、世界の状態(つまり、現在の惑星地球)と観測を区別します。私たちの車にはメモリモジュールがありません。では、現時点で見られないものにどのように対処するのでしょうか?

テクニカルブリーフで自動運転車を増やす

自動運転車の警報システムは故障から学習します。

ミュンヘン工科大学のソフトウェアは、自動運転車を安全な経路に保ちます。

たとえば、誰かとズーム通話をしているとします。あなたは、いわば惑星地球の部分的な観測を知覚します。相手はカメラの視野の外からコーヒーマグを取り、一口飲んで、カメラの視野の外に戻します。マグカップを置いた後の最後の観察だけを考慮して、何を飲むかを尋ねられた場合、あなたは単にわかりません(記憶がないため)。それでも、過去数秒間にいくつかの観測を積み重ねると(「連結」と呼びます)、マグカップがいくつかのフレームで移動しているのを見ると、世界の状態について何かを推測できます。彼らがどれだけ速くそれを動かすかに基づいて、あなたは彼らの気分について何かを言うことができるかもしれません。

同様に、私たちのシナリオでは、各車は、観察スペースから観察できるものに基づいて、他のエージェントのみを知っています(図2に示されている )。内部状態(たとえば、他の車の協調性の値)は不明です。各車両のこれらの部分的な観察のいくつかを連結して、他の車両がどれほど協力的であるかについて暗黙のうちに信じることができるようにします。これを手動で行うのではなく、人工知能であるディープニューラルネットワークにタスクを吸収させます。このニューラルネットはまた、あなたの質問に対する答え、つまり、特定の攻撃性や過度に協力的な行動に気づいた後に何をすべきかを学ぶ必要があります。

技術概要 :モデルはどのように「攻撃的」または「協調的」な行動を記録し、それに応じて対応しますか?

クリストフキリング :たとえば、過度に攻撃的なエージェントは、シナリオのこのボトルネックに直接進み、本質的に他のエージェントを待機させる可能性があります。過度に協力的なエージェントは、ボトルネックの全範囲がセンサーによって認識されるとすぐに、速度を落とし、待機します。ここで、私たちのポリシーは、補完的なアクションをすぐに選択するように訓練されています:減速を検出して進​​む、またはその逆。

技術概要 :この調査の次は何ですか?

クリストフキリング :たくさんのこと:3つの主要なポイント:まず、現在の作業は自動運転車のみと対峙する自動運転車です。これを人間が直面する自動運転車にまで拡張し、それらとどれだけうまく連携できるかを確認する必要があります。第二に、私たちの作業車両では前進のみが可能であり、後進は許可されていません。ただし、これは、行き詰まった状況からの回復に役立つ可能性があります。第三に、私たちの仕事は現在シミュレーションのみです。それを実際のソリューションに転送することは、ある時点で実行する必要のある主要なステップです。

どう思いますか?以下で質問やコメントを共有してください。


センサー

  1. 信号機
  2. スマート信号機
  3. Intelは年末までに100台の自動運転車を世界中に配備する
  4. 自動運転車の安全性を向上させるためのAIの「死角」の発見
  5. 自動運転車は、浅黒い肌の歩行者を検出するのが難しいと感じています
  6. 自動運転車向けの新しいAIが歩行者の動きを予測できる
  7. 分析モデルはバッテリーの能力を評価します
  8. 航空交通シミュレーションツール
  9. センサーは水素自動車のスパークリスクを排除します
  10. 自動運転車の警告システムは故障から学ぶ
  11. 車両がより複雑になるにつれて、最初に何をテストする必要がありますか?