關於強化學習不可行動作處理問題

在強化學習學習過程中,往往存在這樣一種問題:總的動作空間很大,但是在特定狀態下有些動作不可行,如何處理? 例如:迷宮問題中當智能體處於迷宮邊緣(1,1),此時採取向左或者向上的動作都會超出迷宮邊緣。 在現實生活中確實有很多不可執行的動作,受到很多約束限制。目前所瞭解到的處理方式有以下幾種: 1. 把動作集分爲兩部分:可執行動作和不可行執行動作。在選擇動作的時候在可行動作的範圍內。 2. 通過對動作
相關文章
相關標籤/搜索