強化學習二：Markov Processes

時間 2020-08-21

標籤強化學習 markov processes 简体版

原文原文鏈接

強化學習二：Markov Processes 1、前言在第一章強化學習簡介中，咱們提到強化學習過程能夠看作一系列的state、reward、action的組合。本章咱們將要介紹馬爾科夫決策過程（Markov Decision Processes)用於後續的強化學習研究中。html 2、馬爾科夫過程（Markov Processes） 2.1 馬爾科夫性首先，咱們須要瞭解什麼是馬爾科夫性：函數

>>阅读原文<<