深度強化學習系列（二）：強化學習基礎

時間 2021-01-01

原文原文鏈接

本文是強化學習的基礎，主要參考 Divid Silver 教程，Reinforcement Learning：An Introduction，以及周志華的西瓜書。可能之前大家已經聽過了強化學習的介紹，因此，我首先問幾個問題：強化學習和MDP過程是一回事嗎？強化學習和監督學習的區別是什麼？什麼是值迭代，什麼是策略迭代？有模型和無模型的強化學習的各自有什麼樣的學習方法？強化學習和深度學習其

>>阅读原文<<