近期看到AlphaGo算法最清晰的解讀

作者:西樓,USC神經科學的PHD & 圍棋業餘4段 最近DeepMind團隊(google旗下)的AlphaGo(一個圍棋的AI)以4:1戰勝頂尖人類職業棋手李世石。她到底是怎麼下棋的? AlphaGo在面對當前棋局時,她會模擬(推演棋局)N次,選取「模擬」次數最多的走法,這就是AlphaGo認爲的最優走法。 例如圖中,所有沒有落子的地方都是可能下子的,但在模擬中,右下那步走了79%次, 就選那
相關文章
相關標籤/搜索