簡單的PPO算法筆記

學習了莫煩講解的PPO,寫了點自己的理解筆記,希望能幫到你們。 代碼 代碼可以去上面的鏈接自己下載跑一下,這邊也給出我參考莫煩自己學的,基本是一樣的: import gym import tensorflow as tf import numpy as np import matplotlib.pyplot as plt EP_MAX = 1000 EP_LEN = 200 BATCH = 3
相關文章
相關標籤/搜索