AlphaGo Zero 初探

時間 2021-07-14

原文原文鏈接

Deepmind 最近發佈了 AlphaGo 的最新版本 AlphaGo Zero 的論文，AlphaGo 不再需要學習人類的經驗，而是可以自己學習如何下圍棋，而且最新的 Zero 可以打敗之前的版本。首先，圍棋這個遊戲是很難用暴力方法來搜索最優路徑的，拿只有 9 格的 tic tac toe 遊戲來說就有 3^9 ～ 19 000 種可能，每個格子可以是 ❌ ⭕️ 空白三種可能。 AI 如

>>阅读原文<<