強化學習筆記1-有限馬爾可夫決策過程

這個系列的筆記打算寫的是看了david silver的視頻和sutton的introduction to rl(前幾章)後的摘要,大概就是我覺得重要的東西。 我發現david silver的視頻和introduction在大綱內容上是非常相似的,具體細節上,David silver的視頻更強調實用,會有一些比較新的內容,sutton的書更理論,有助於完整地理解強化學習的本質。 這個筆記的內容不一定
相關文章
相關標籤/搜索