論文閱讀筆記《One-Shot Imitation Learning》

基本思想   模仿學習,顧名思義就是機器人通過模仿示教動作(Demonstration)從而學會完成某項任務的過程,這裏包含幾個重要的概念:狀態(State, S t S_t St​),動作(Action, A t A_t At​),示教動作(Demo)和策略(表現爲神經網絡的參數 θ \theta θ),模仿學習就要利用神經網絡實現根據當前的狀態,示教動作和學習策略得到要執行的動作, A t =
相關文章
相關標籤/搜索