AIベースのロボットがジェンガのゲームをプレイすることを学ぶ
- 研究者は、触覚と視覚を使用してジェンガのゲームを学習するロボットアームを開発しています。
- この作業で開発された機械学習方法は、ロボットが消費者製品を組み立てたり、注意深い物理的相互作用を必要とするその他のタスクを実行したりするのに役立ちます。
ジェンガは、正確な目と手の協調と戦略を必要とする複雑なゲームです。人間として、私たちは視覚と触覚をシームレスに統合して、このゲームをマスターします。一方、ロボットはまだこのレベルの洗練度を備えていません。
ほとんどのロボット学習システムは、触覚のない視覚データのみを使用します。これにより、基本的に外界について学習する能力が制限されます。モデルフリーの強化学習手法に基づく既存の学習アルゴリズムには、物理的なオブジェクト、接触、または力に関する知識を活用する能力がほとんどまたはまったくありません。
最近、MITのMCube Labの研究者は、ロボットを使用してこの能力を再現するアルゴリズムを開発しました。大量のデータセットを使用して次善の動きを評価する従来の機械学習手法とは異なり、このロボットは、断片の穏やかで正確な抽出を可能にする階層モデルを学習して活用します。
ジェンガ-遊ぶロボット
ロボットには、外部RGBカメラ、ソフトプロンググリッパー、および力を感知する手首カフが装備されています。これらすべてのコンポーネントにより、ロボットはJengaタワーとその個々のブロックを観察して感じることができます。
研究者たちは、産業用ABB IRB 120ロボットアームをカスタマイズし、その手の届くところにJengaタワーを設置しました。腕がブロックを優しく押すと、コンピューターがカフとカメラから触覚と視覚のフィードバックをキャプチャし、これらの測定値をロボットの以前の動きと比較します。
参照:ScienceRobotics | doi:10.1126 / scirobotics.aav3123 | MIT
このモデルにより、ロボットはピースの状態を正確に推定し、次に可能な動きをシミュレートして、好ましい動きを決定することができます。機械は、構造が崩壊するのを防ぐために、ブロックを押し続けるか、新しいブロックに移動するかをリアルタイムで学習します。
これは、チェスや囲碁用のAIを開発するよりも困難です。ジェンガのゲームでは、個々のブロックを引っ張ったり、押したり、配置したり、位置合わせしたりするなどの基本的な物理スキルが必要です。
この作業で開発されたロボットは、ブロックがスタックまたはフリーになったことを効率的に識別し、はるかに少ないデータを使用してブロックを抽出する方法を決定します。これは、(数万回の試行ではなく)300回近くの試行でトレーニングされます。同様の結果と測定の試みはクラスターにグループ化され、各クラスターは特定のブロック動作を表します。
単一のデータクラスターごとに、マシンは、現在の触覚的および視覚的測定値を前提として、ブロックの動作を推定するモデルを開発しました。このクラスタリング戦略は、人間が自然に学習する方法に触発されており、ロボットがゲームのプレイを学習できる効率を大幅に向上させます。
アプリケーション
この方法は、人工知能が物理的な世界に移動する成功例です。ロボットが周囲と相互作用するにつれて、人間の操作を定義する基本的なスキルのいくつかを学習します。
読む:ダクティル:AIを使用して前例のない器用さを実現する人間のようなロボットの手
この触覚学習システムは、ジェンガのゲームを超えたタスク、特に注意深い物理的相互作用を必要とするタスクに適用できます。たとえば、消費者製品を組み立てたり、リサイクル可能な材料を埋め立てゴミから分離したりします。
たとえば、スマートフォンとラップトップの組立ラインでは、ほとんどの手順で視覚だけでなくタッチとフォースのアクションが必要であり、このテクノロジーによってそのような組立ラインが大幅に改善される可能性があります。
産業技術