AlphaGo Zero 初探

Deepmind 最近發佈了 AlphaGo 的最新版本 AlphaGo Zero  的論文,AlphaGo 不再需要學習人類的經驗,而是可以自己學習如何下圍棋,而且最新的 Zero 可以打敗之前的版本。 首先,圍棋這個遊戲是很難用暴力方法來搜索最優路徑的,拿只有 9 格的 tic tac toe 遊戲來說就有 3^9 ~ 19 000 種可能,每個格子可以是 ❌ ⭕️ 空白 三種可能。 AI 如
相關文章
相關標籤/搜索