關於百度強化學習七日打卡營——一個菜鳥的學習感悟

1.剛開始第一個作業搭建環境PARL: PARL是一個算法庫,是對Agent的框架抽象。簡單來說就是在一臺機器上調用pip install parl,就可以啓動集羣並行計算,使運算加速。 PS:心裏竊喜,對於我們小白,非常友好,因爲之前有機器學習的基礎,又經常 白嫖 參加aistudio的活動,所以上手非常快,沒有兩分鐘就幹完了。 2.迷宮遊戲對比Sarsa和Q-learning Sarsa的學習
相關文章
相關標籤/搜索