僅剩296個免費名額,AI工程師進階必修課今日領取

加州大學洛杉磯分校計算機科學專業的 Ray Zhang 最近開始在自己的博客上連載介紹強化學習的文章,這些介紹文章主要基於 Richard S. Sutton 和 Andrew G. Barto 合著的《Reinforcement Learning: an Introduction》,並添加了一些示例說明。該系列文章現已介紹了賭博機問題、馬爾可夫決策過程和蒙特卡洛方法。本文是對其中蒙特卡洛方法文章
相關文章
相關標籤/搜索