僅剩296個免費名額，AI工程師進階必修課今日領取

時間 2020-12-29

原文原文鏈接

加州大學洛杉磯分校計算機科學專業的 Ray Zhang 最近開始在自己的博客上連載介紹強化學習的文章，這些介紹文章主要基於 Richard S. Sutton 和 Andrew G. Barto 合著的《Reinforcement Learning: an Introduction》，並添加了一些示例說明。該系列文章現已介紹了賭博機問題、馬爾可夫決策過程和蒙特卡洛方法。本文是對其中蒙特卡洛方法文章

>>阅读原文<<