強化學習-->Deep Reinforcement Learning

由於逐漸有人將強化學習應用到 NLP 的任務上,有必要了解一些強化學習基礎知識,本篇博文總結自臺大教授李宏毅關於深度學習的公開課內容。web 咱們能夠以上圖來理解強化學習過程,咱們機器人 agent 經過 observation 瞭解到環境的 State ,採起一些 Action ,而且改變當前的環境,而後環境會反饋正向或負向的 reward 給 agent 。網絡 舉例來講,讓機器人玩電玩遊戲:
相關文章
相關標籤/搜索