強化學習二:Markov Processes

強化學習二:Markov Processes 一、前言 在第一章強化學習簡介中,我們提到強化學習過程可以看做一系列的state、reward、action的組合。本章我們將要介紹馬爾科夫決策過程(Markov Decision Processes)用於後續的強化學習研究中。 二、馬爾科夫過程(Markov Processes) 2.1 馬爾科夫性 首先,我們需要了解什麼是馬爾科夫性: 當我們處於狀
相關文章
相關標籤/搜索