強化學習的兩大話題之一，仍有極大探索空間

時間 2021-01-21

原文原文鏈接

來源 | AI科技評論編譯 | bluemin 編輯 | 陳彩嫺探索 VS 利用，這是強化學習中至關重要的話題。我們希望強化學習中的智能體儘快找到最佳策略。然而，在沒有充分探索的情況下就盲目地選擇某個策略會帶來一定的問題，因爲這會導致模型陷入局部最優甚至完全不收斂。目前的強化學習算法朝着回報值最大化的方向優化，而探索仍然更像是一個開放性話題。本文討論幾種常見的深度強化學習探索策略。由於這

>>阅读原文<<