基於分位數迴歸的分佈強化學習(Distributional Reinforcemet Learning with Quantile Regression)

摘要 Deep Mind團隊聯合劍橋大學在2017年提出了一種新的強化學習範式——基於分位數迴歸的分佈強化學習(QR-DRL),爲強化學習的將來發展指明瞭一個更加有前景的方向,以學習回報值的機率分佈來代替學習回報值的指望值。Deep Mind的論文經過在atari遊戲中的實驗,證實了QR-DRL的強大性能,在衆多遊戲中都達到了state-of-art。私覺得QR-DRL是近年來爲數很少的,從根本理
相關文章
相關標籤/搜索