強化學習筆記1-有限馬爾可夫決策過程

這個系列的筆記打算寫的是看了david silver的視頻和sutton的introduction to rl(前幾章)後的摘要,大概就是我以爲重要的東西。html 我發現david silver的視頻和introduction在大綱內容上是很是類似的,具體細節上,David silver的視頻更強調實用,會有一些比較新的內容,sutton的書更理論,有助於完整地理解強化學習的本質。web 這個筆
相關文章
相關標籤/搜索