強化學習三:Dynamic Programming

強化學習三:Dynamic Programming 1,Introduction 1.1 What is Dynamic Programming?     Dynamic:某個問題是由序列化狀態組成,狀態step-by-step的改變,從而可以step-by-step的來解這個問題。     Programming:是在已知環境動力學的基礎上進行評估和控制,具體來說就是在瞭解包括狀態和行爲空間、轉
相關文章
相關標籤/搜索