PyTorch 強化學習 01.強化學習（DQN）

時間 2021-01-02

標籤 PyTorch 算法 python 深度學習 java 人工智能欄目 Python 简体版

原文原文鏈接

本教程介紹如何使用PyTorch從OpenAI Gym中的 CartPole-v0 任務上訓練一個Deep Q Learning (DQN) 代理。 1.任務代理人必須在兩個動作之間做出決定 – 向左或向右移動推車 – 以使連接到它的杆保持直立。您可以在Gym 網站上找到官方排行榜，裏面包含各種算法以及可視化。當代理觀察環境的當前狀態並選擇動作時，環境轉換到新狀態，並且還返回指示動作的

>>阅读原文<<