論文閱讀之:PRIORITIZED EXPERIENCE REPLAY

  PRIORITIZED EXPERIENCE REPLAY ICLR 2016   經驗回放使得 online reinforcement learning agent 能夠記住並且回放過去的經驗。在先前的工作中,從回放記憶中隨機的採樣 experience transitions。但是,這種方法簡單的在同一頻率 回放 transitions,而不管其意義。本文提出了一種方法能夠實現優先回放,
相關文章
相關標籤/搜索