Deep Reinforcement Learning for High Precision Assembly Tasks

時間 2021-01-02

原文原文鏈接

文獻目錄本篇論文的目的是控制機械臂在組件裝配精度高於機器人控制精度的情況下實現軸孔的裝配。本文使用雙層LSTM網絡結構來作爲狀態-行爲價值函數Q的近似，輸入爲機械臂的力-力矩傳感器反饋信號以及機械臂末端的近似位置，輸出爲機械臂末端三個軸上施加的力與兩個方向上姿態的旋轉角度。從演示視頻來看效果還是很不錯的。該論文實驗中有一個前置條件：假設軸已經被抓且與孔板相接觸。那麼這篇論文其實就是分兩步走：一