Muzero算法研讀報告

時間 2021-01-21

標籤機器學習強化學習简体版

原文原文鏈接

面試的時候被要求瞭解muzero相關算法，本文根據Julian 等人在2020年發表的」Mastering Atari, Go, Chess and Shogi by Planning with a Learned Mode」一文，研讀並彙報了文中的Muzero算法。相對於Alpha zero, Muzero無需預先了解遊戲的遊戲規則，比如在棋盤遊戲中，只需要去告知哪一步的移動是被允許的，就可以

>>阅读原文<<