Learning to play snake at 1 million FPS Playing snake with advantage actor-critic

在這篇博文中,我將引導您完成我最近的項目,該項目結合了我發現的兩件令人着迷的東西 - 電腦遊戲和機器學習。 很長一段時間以來,我一直想深入瞭解強化學習,我認爲沒有比做自己的項目更好的方法了。 爲此,我在PyTorch中實現了經典的手機遊戲「Snake」,並訓練了強化學習算法來進行遊戲。 這篇文章分爲三個部分。 Snake遊戲的大規模並行矢量化實現 Advantage Actor-Critic(A2
相關文章
相關標籤/搜索