強化學習之Mujuco的環境使用介紹

1.介紹 在編寫強化學習模型的時候,希望去知道自己的模型能應用的遊戲環境是什麼樣的。核心就是,需要知道遊戲環境的狀態空間和動作空間是什麼樣的。爲什麼需要知道遊戲環境的狀態空間和動作空間呢?將從兩個例子分別說明: 例1:如果要將DQN模型應用到遊戲環境上,由於DQN只能處理離散動作空間的問題,那就必須知道什麼遊戲環境的動作空間離散的。而對於連續動作空間,我們就可以用DDPG、TD3等模型去處理。因此
相關文章
相關標籤/搜索