強化學習之Mujuco的環境使用介紹

時間 2021-06-28

原文原文鏈接

1.介紹在編寫強化學習模型的時候，希望去知道自己的模型能應用的遊戲環境是什麼樣的。核心就是，需要知道遊戲環境的狀態空間和動作空間是什麼樣的。爲什麼需要知道遊戲環境的狀態空間和動作空間呢？將從兩個例子分別說明：例1：如果要將DQN模型應用到遊戲環境上，由於DQN只能處理離散動作空間的問題，那就必須知道什麼遊戲環境的動作空間離散的。而對於連續動作空間，我們就可以用DDPG、TD3等模型去處理。因此

>>阅读原文<<