強化學習——從Q-Learning到DQN到底發生了什麼?

1 學習目標 1. 複習Q-Learning;python 2. 理解什麼是值函數近似(Function Approximation);web 3. 理解什麼是DQN,弄清它和Q-Learning的區別是什麼。算法 2 用Q-Learning解決經典迷宮問題 現有一個5房間的房子,如圖1所示,房間與房間之間經過門鏈接,編號0到4,5號是房子外邊,即咱們的終點。咱們將agent隨機放在任一房間內,每
相關文章
相關標籤/搜索