強化學習入門……的入門

強化學習是機器學習裏面非常重要的一個派別。智能體 (agent) 會不斷執行一些操作,通過結果來學習,在不同的環境中分別應該採取怎樣的行動。 在一系列教學文章裏,我們可以瞭解不同的架構,來解決強化學習的問題。Q學習,深度Q網絡 (DQN) ,策略梯度 (Policy Gradients) ,演員-評論家 (Actor-Critic) ,以及近端策略優化 (PPO) 都是將要涉及的算法。 這是本系列
相關文章
相關標籤/搜索