強化學習超進化:經典問題 30 年後驚現閉式解;TensorFlow2 強化學習教程 GitHub 代碼大公開

強化學習經典控制問題 30 年後驚現閉式解 MountainCar-v0 是 Andrew Moore 在 1990 年提出的控制問題,提出後受到強化學習界的廣泛關注,並收錄到強化學習影響力最大的環境庫之一 Gym 中,成爲大多數強化學習教程中必用的環境。 圖1 經典控制問題MountainCar-v0(圖片來源:https://gym.openai.com/envs/MountainCar-v0
相關文章
相關標籤/搜索