李宏毅機器學習系列-強化學習之模仿學習

李宏毅機器學習系列-強化學習之模仿學習 模仿學習 行爲複製(Behavior Cloning) 逆向強化學習(Inverse Reinforcement Learning (IRL)) 第三人稱模仿學習: 總結 模仿學習 模仿學習就是根據演示來學習,不少時候咱們的任務沒辦法定義獎勵,可是咱們能夠收集不少的數據給機器去學習,方法通常有兩種,一種叫行爲複製,一種叫逆向強化學習: web 行爲複製(Be
相關文章
相關標籤/搜索