基於分位數迴歸的分佈強化學習(Distributional Reinforcemet Learning with Quantile Regression)

摘要 Deep Mind團隊聯合劍橋大學在2017年提出了一種新的強化學習範式——基於分位數迴歸的分佈強化學習(QR-DRL),爲強化學習的未來發展指明瞭一個更加有前景的方向,以學習回報值的概率分佈來代替學習回報值的期望值。Deep Mind的論文通過在atari遊戲中的實驗,證明了QR-DRL的強大性能,在衆多遊戲中都達到了state-of-art。私以爲QR-DRL是近年來爲數不多的,從根本理
相關文章
相關標籤/搜索