一文讀懂AlphaGo背後的強化學習

時間 2020-12-31

原文原文鏈接

本文是強化學習名作——「Reinforcement Learning: an Introduction」一書中最爲重要的內容，旨在介紹學習強化學習最基礎的概念及其原理，讓讀者能夠儘快的實現最新模型。畢竟，對任何機器學習實踐者來說，RL（強化學習，即Reinforcement Learning）都是一種十分有用的工具，特別是在AlphaGo的盛名之下。第一部分，我們將具體瞭解了MDPs (馬爾可夫

>>阅读原文<<