PyTorch 強化學習 01.強化學習(DQN)

本教程介紹如何使用PyTorch從OpenAI Gym中的 CartPole-v0 任務上訓練一個Deep Q Learning (DQN) 代理。 1.任務 代理人必須在兩個動作之間做出決定 – 向左或向右移動推車 – 以使連接到它的杆保持直立。您可以在Gym 網站上找到官方排行榜,裏面包含各種算法以及可視化。     當代理觀察環境的當前狀態並選擇動作時,環境轉換到新狀態,並且還返回指示動作的
相關文章
相關標籤/搜索