強化學習的探索空間在哪?道翰天瓊認知智能機器人平臺API接口大腦爲您揭祕-2。

  探索 VS 利用,這是強化學習中至關重要的話題。我們希望強化學習中的智能體儘快找到最佳策略。然而,在沒有充分探索的情況下就盲目地選擇某個策略會帶來一定的問題,因爲這會導致模型陷入局部最優甚至完全不收斂。目前的強化學習算法朝着回報值最大化的方向優化,而探索仍然更像是一個開放性話題。本文討論幾種常見的深度強化學習探索策略。由於這個話題非常龐大,本文並不能涵蓋所有的內容。    1 經典探索策略首先
相關文章
相關標籤/搜索