強化學習(DQN)教程REINFORCEMENT LEARNING (DQN) TUTORIAL

本教程顯示瞭如何使用PyTorch在OpenAI Gym的CartPole-v0任務上訓練深度Q學習(DQN)agent。 agent必須在兩個動作之間做出決定-向左或向右移動推車-以便使與之相連的電線杆保持直立。您可以在Gym網站上找到具有各種算法和可視化效果的官方排行榜 。     cartpole 當代理觀察環境的當前狀態並選擇一個動作時,環境會轉換爲新狀態,並返回指示該動作後果的獎勵。在此
相關文章
相關標籤/搜索