Muzero算法研讀報告

面試的時候被要求瞭解muzero相關算法,本文根據Julian 等人在2020年發表的」Mastering Atari, Go, Chess and Shogi by Planning with a Learned Mode」 一文,研讀並彙報了文中的Muzero算法。相對於Alpha zero, Muzero無需預先了解遊戲的遊戲規則,比如在棋盤遊戲中,只需要去告知哪一步的移動是被允許的,就可以
相關文章
相關標籤/搜索