AlphaGo與蒙特卡羅樹搜索

導語 多臂賭博機問題 馬爾可夫決策過程 MDPs 蒙特卡羅與馬爾可夫決策過程 UniformBandit Algorithm Policy Rollout Algorithm Multi-Stage Rollout Sparse Sampling UCB1算法 UCT算法 結語 疑問 參考資料 導語 2016年 AlphaGo 橫空出世,在AI界和圍棋界掀起了一陣腥風血雨。寶刀一出,無數圍棋高手如
相關文章
相關標籤/搜索