李宏毅機器學習系列-強化學習之模仿學習

時間 2020-01-16

標籤機器學習系列強化模仿简体版

原文原文鏈接

李宏毅機器學習系列-強化學習之模仿學習模仿學習行爲複製(Behavior Cloning) 逆向強化學習(Inverse Reinforcement Learning (IRL)) 第三人稱模仿學習：總結模仿學習模仿學習就是根據演示來學習，不少時候咱們的任務沒辦法定義獎勵，可是咱們能夠收集不少的數據給機器去學習，方法通常有兩種，一種叫行爲複製，一種叫逆向強化學習： web 行爲複製(Be

>>阅读原文<<