近期看到AlphaGo算法最清晰的解讀

時間 2021-01-21

原文原文鏈接

作者：西樓，USC神經科學的PHD & 圍棋業餘4段最近DeepMind團隊（google旗下）的AlphaGo（一個圍棋的AI）以4:1戰勝頂尖人類職業棋手李世石。她到底是怎麼下棋的？ AlphaGo在面對當前棋局時，她會模擬(推演棋局)N次，選取「模擬」次數最多的走法，這就是AlphaGo認爲的最優走法。例如圖中，所有沒有落子的地方都是可能下子的，但在模擬中，右下那步走了79%次，就選那