論文閱讀之：PRIORITIZED EXPERIENCE REPLAY

時間 2021-01-19

原文原文鏈接

PRIORITIZED EXPERIENCE REPLAY ICLR 2016 　　經驗回放使得 online reinforcement learning agent 能夠記住並且回放過去的經驗。在先前的工作中，從回放記憶中隨機的採樣 experience transitions。但是，這種方法簡單的在同一頻率回放 transitions，而不管其意義。本文提出了一種方法能夠實現優先回放，

>>阅读原文<<