犬の訓練方法はロボットに新しいトリックを学ぶように教える
コンピューター科学者は、犬に座ってとどまるように教えるために一般的に使用されるトレーニング技術を使用して、ブロックを積み重ねるなど、いくつかの新しいトリックをロボットに教える方法を示しました。この方法により、ロボット(Spotという名前)は、通常1か月かかるものを数日で学習することができました。チームは、犬の行動を変えるために御馳走を使用した人なら誰でも知っているアプローチである積極的な強化を使用することで、ロボットのスキルを劇的に向上させ、実際の作業用のトレーニングロボットをより実現可能な企業にするのに十分な速さで行いました。
非常に直感的な脳で生まれた人間や動物とは異なり、コンピューターは白紙の状態であり、すべてをゼロから学習する必要があります。しかし、真の学習は試行錯誤で達成されることが多く、ロボット工学者はロボットが間違いから効率的に学習する方法をまだ理解しています。チームは、ロボットのために働く報酬システムを考案することによって、犬のための仕事を扱う方法を考案することによってそれを達成しました。犬がよくやった仕事のためにクッキーを手に入れるかもしれないところで、ロボットは数値ポイントを獲得しました。
ブロックを積み重ねるには、建設的な行動に集中する方法を学ぶために必要なロボットを見つけます。ロボットがブロックを探索すると、スタッキングの正しい動作は高いポイントを獲得しましたが、間違った動作は何も獲得しなかったことがすぐにわかりました。最後のブロックを4ブロックのスタックの上に置くことで、スポットが最も多く獲得しました。
トレーニング戦術はうまくいっただけでなく、ロボットに何週間もかかっていたものを教えるのにほんの数日しかかかりませんでした。チームは、最初にビデオゲームによく似たシミュレートされたロボットをトレーニングし、次にSpotでテストを実行することにより、練習時間を短縮することができました。ロボットは、最高の報酬を得るために正しい行動をすばやく学習します。実際、ロボットが100%の精度を達成するために、1か月の練習が必要だったのは、2日で完了しました。
積極的な強化は、ロボットがブロックを積み重ねることを自分自身に教えるのを助けるだけでなく、ポイントシステムでも機能し、ロボットは他のいくつかのタスクをすばやく学習しました。シミュレートされたナビゲーションゲームのプレイ方法も同様です。新しい環境に適応できるロボットを設計するには、あらゆる種類の状況での間違いから学ぶ能力が重要です。
チームは、これらの調査結果が、家庭用ロボットが洗濯や食器洗いを行うように訓練するのに役立つと考えています。これは、高齢者が自立して生活するのに役立つ可能性のあるタスクです。また、改良された自動運転車の設計や製品の組み立てにも役立ちます。
詳細については、JillRosenまでお問い合わせください。このメールアドレスはスパムボットから保護されています。表示するにはJavaScriptを有効にする必要があります。; 443-547-8805。
自動制御システム