【ICLR2020】基於模型的強化學習算法玩Atari【附代碼】

論文題目:Model Based Reinforcement Learning for Atari 所解決的問題?   model-free的強化學習算法已經在Atari遊戲上取得了巨大成功,但是與人類選手相比,model-free的強化學習算法需要的交互數據往往大地多。其根本原因在於人類選手能夠很容易學習到遊戲的大概運行規律,從而進行預測規劃。因此爲了達到用少量數據學習控制Atari遊戲的目的,
相關文章
相關標籤/搜索