強化學習w/ Keras + OpenAI的實踐:Actor-Critic模型

快速回顧 在上次的Keras/OpenAI教程中,討論了一個非常基礎的強化學習算法——DQN(深度Q網絡)。這個「深度Q網絡」是近幾年剛出現的新興事物,所以,如果你能夠理解甚至運用這個算法,那就太了不起了。首先,還是快速地回顧一下取得的驚人成績:一開始,對於一個好算法的開發幾乎一概不知;而現在,已經能夠探索的環境,並且完成試驗了。 可以設身處地的想,這有點像讓你玩一個既沒有遊戲規則,也沒有最終目標
相關文章
相關標籤/搜索