學習總結——強化學習入門

時間 2021-01-13

標籤機器學習強化學習算法简体版

原文原文鏈接

近期參加了百度飛槳的零基礎入門強化學習課程，經過7天的教學+實踐的方式入門學習強化學習，從完成小項目的形式加深對強化學習一些概念和算法的理解和消化。在課程的最後，對整個課程做個簡單的知識總結。目錄強化學習(RL) 概念學習方案學習框架基於表格型方法求解RL Sarsa Q-learning 區別對比基於神經網絡方法求解RL DQN算法算法流程基於策略梯度方法求解RL Policy

>>阅读原文<<