強化學習二：Markov Processes

時間 2021-01-12

原文原文鏈接

強化學習二：Markov Processes 一、前言在第一章強化學習簡介中，我們提到強化學習過程可以看做一系列的state、reward、action的組合。本章我們將要介紹馬爾科夫決策過程（Markov Decision Processes)用於後續的強化學習研究中。二、馬爾科夫過程（Markov Processes） 2.1 馬爾科夫性首先，我們需要了解什麼是馬爾科夫性：當我們處於狀

>>阅读原文<<