強化學習入門……的入門

時間 2021-01-17

原文原文鏈接

強化學習是機器學習裏面非常重要的一個派別。智能體 (agent) 會不斷執行一些操作，通過結果來學習，在不同的環境中分別應該採取怎樣的行動。在一系列教學文章裏，我們可以瞭解不同的架構，來解決強化學習的問題。Q學習，深度Q網絡 (DQN) ，策略梯度 (Policy Gradients) ，演員-評論家 (Actor-Critic) ，以及近端策略優化 (PPO) 都是將要涉及的算法。這是本系列

>>阅读原文<<