AlphaGo原理淺析

AlphaGo 論文:   AlphaGo:《Mastering the game of Go with deep neural networks and tree search》 核心部件:   - 監督學習的策略網絡(SL policy network)     13layers CNN network     輸入:當前state     輸出:所有可能action的概率分佈     更新策
相關文章
相關標籤/搜索