基於分位數迴歸的分佈強化學習（Distributional Reinforcemet Learning with Quantile Regression)

時間 2021-01-15

標籤深度強化學習強化學習 Deep Mind 简体版

原文原文鏈接

摘要 Deep Mind團隊聯合劍橋大學在2017年提出了一種新的強化學習範式——基於分位數迴歸的分佈強化學習（QR-DRL），爲強化學習的未來發展指明瞭一個更加有前景的方向，以學習回報值的概率分佈來代替學習回報值的期望值。Deep Mind的論文通過在atari遊戲中的實驗，證明了QR-DRL的強大性能，在衆多遊戲中都達到了state-of-art。私以爲QR-DRL是近年來爲數不多的，從根本理

>>阅读原文<<