一文讀懂AlphaGo背後的強化學習

本文是強化學習名作——「Reinforcement Learning: an Introduction」一書中最爲重要的內容,旨在介紹學習強化學習最基礎的概念及其原理,讓讀者能夠儘快的實現最新模型。畢竟,對任何機器學習實踐者來說,RL(強化學習,即Reinforcement Learning)都是一種十分有用的工具,特別是在AlphaGo的盛名之下。 第一部分,我們將具體瞭解了MDPs (馬爾可夫
相關文章
相關標籤/搜索