強化學習的探索空間在哪？道翰天瓊認知智能機器人平臺API接口大腦爲您揭祕-2。

時間 2021-01-11

原文原文鏈接

探索 VS 利用，這是強化學習中至關重要的話題。我們希望強化學習中的智能體儘快找到最佳策略。然而，在沒有充分探索的情況下就盲目地選擇某個策略會帶來一定的問題，因爲這會導致模型陷入局部最優甚至完全不收斂。目前的強化學習算法朝着回報值最大化的方向優化，而探索仍然更像是一個開放性話題。本文討論幾種常見的深度強化學習探索策略。由於這個話題非常龐大，本文並不能涵蓋所有的內容。 1 經典探索策略首先