基本概念篇(二),強化學習過程

上篇文章介紹了強化學習的八個基本要素,利用這些要素,我們就可以將一個完整的強化學習過程描述出來。 強化學習基本過程與目標 大家在看其他的參考書時,在這部分其實都是把強化學習的過程描述爲一個「馬爾科夫決策過程」。我們首先可以回憶一下上一節中那個圖,首先就是將強化學習過程離散化,分成一步一步的過程。那麼這其中最重要的馬爾科夫特性,其實講的就是每一步之間的關係。簡單來說,就是系統這一步的狀態,只與系統前
相關文章
相關標籤/搜索