學習總結——強化學習入門

近期參加了百度飛槳的零基礎入門強化學習課程,經過7天的教學+實踐的方式入門學習強化學習,從完成小項目的形式加深對強化學習一些概念和算法的理解和消化。在課程的最後,對整個課程做個簡單的知識總結。 目錄 強化學習(RL) 概念 學習方案 學習框架 基於表格型方法求解RL Sarsa Q-learning 區別對比 基於神經網絡方法求解RL DQN算法 算法流程 基於策略梯度方法求解RL Policy
相關文章
相關標籤/搜索