強化學習——從Q-Learning到DQN到底發生了什麼？

時間 2020-05-23

標籤強化學習 learning dqn 到底發生了什麼简体版

原文原文鏈接

1 學習目標 1. 複習Q-Learning；python 2. 理解什麼是值函數近似（Function Approximation）；web 3. 理解什麼是DQN，弄清它和Q-Learning的區別是什麼。算法 2 用Q-Learning解決經典迷宮問題現有一個5房間的房子，如圖1所示，房間與房間之間經過門鏈接，編號0到4,5號是房子外邊，即咱們的終點。咱們將agent隨機放在任一房間內，每

>>阅读原文<<