強化學習（DQN）教程REINFORCEMENT LEARNING (DQN) TUTORIAL

時間 2021-01-02

原文原文鏈接

本教程顯示瞭如何使用PyTorch在OpenAI Gym的CartPole-v0任務上訓練深度Q學習（DQN）agent。 agent必須在兩個動作之間做出決定-向左或向右移動推車-以便使與之相連的電線杆保持直立。您可以在Gym網站上找到具有各種算法和可視化效果的官方排行榜。 cartpole 當代理觀察環境的當前狀態並選擇一個動作時，環境會轉換爲新狀態，並返回指示該動作後果的獎勵。在此

>>阅读原文<<