強化學習二:Markov Processes

強化學習二:Markov Processes 1、前言 在第一章強化學習簡介中,咱們提到強化學習過程能夠看作一系列的state、reward、action的組合。本章咱們將要介紹馬爾科夫決策過程(Markov Decision Processes)用於後續的強化學習研究中。html 2、馬爾科夫過程(Markov Processes) 2.1 馬爾科夫性 首先,咱們須要瞭解什麼是馬爾科夫性:函數
相關文章
相關標籤/搜索