基於分位數迴歸的分佈強化學習（Distributional Reinforcemet Learning with Quantile Regression)

時間 2020-07-14

標籤基於位數迴歸分佈強化學習 distributional reinforcemet learning quantile regression 简体版

原文原文鏈接

摘要 Deep Mind團隊聯合劍橋大學在2017年提出了一種新的強化學習範式——基於分位數迴歸的分佈強化學習（QR-DRL），爲強化學習的將來發展指明瞭一個更加有前景的方向，以學習回報值的機率分佈來代替學習回報值的指望值。Deep Mind的論文經過在atari遊戲中的實驗，證實了QR-DRL的強大性能，在衆多遊戲中都達到了state-of-art。私覺得QR-DRL是近年來爲數很少的，從根本理

>>阅读原文<<