強化學習的兩大話題之一,仍有極大探索空間

來源 |  AI科技評論 編譯 | bluemin  編輯 | 陳彩嫺 探索 VS 利用,這是強化學習中至關重要的話題。我們希望強化學習中的智能體儘快找到最佳策略。然而,在沒有充分探索的情況下就盲目地選擇某個策略會帶來一定的問題,因爲這會導致模型陷入局部最優甚至完全不收斂。目前的強化學習算法朝着回報值最大化的方向優化,而探索仍然更像是一個開放性話題。 本文討論幾種常見的深度強化學習探索策略。由於這
相關文章
相關標籤/搜索