強化學習w/ Keras + OpenAI的實踐：Actor-Critic模型

時間 2021-01-14

原文原文鏈接

快速回顧在上次的Keras/OpenAI教程中，討論了一個非常基礎的強化學習算法——DQN（深度Q網絡）。這個「深度Q網絡」是近幾年剛出現的新興事物，所以，如果你能夠理解甚至運用這個算法，那就太了不起了。首先，還是快速地回顧一下取得的驚人成績：一開始，對於一個好算法的開發幾乎一概不知；而現在，已經能夠探索的環境，並且完成試驗了。可以設身處地的想，這有點像讓你玩一個既沒有遊戲規則，也沒有最終目標