有關迭代學習控制的一些基本概念

時間 2020-06-10

標籤有關迭代學習控制一些基本概念简体版

原文原文鏈接

有關迭代學習控制的一些基本概念這一篇主要講一些在學習控制研究領域中經常遇到的基本概念和專業的英語表述方式,至關於先入門吧. 馬爾科夫決策過程（Markov decision processes, MDP）以移動機器人走地圖的例子來講明MDP。MDP是一個五元組 (S,A,Psa,γ,R) ，包括： web 元含義解釋 S 狀態集,全部可能出現的狀態全部機器人可能出現的位置 A 動做集

>>阅读原文<<