百度深度強化學習框架PARL技術學習筆記

目錄 前言:寄語 基礎準備和預習 第一節課:玩個簡單的迷宮遊戲吧 第二節課:基於表格型方法求解RL 1, SARSA算法 2,Q-Learning算法 第三節課:基於神經網絡求解RL 第三節課:基於策略梯度求解RL 第四節課:連續動做空間上求解RL 前言:寄語 這是一門深度強化學習基礎實踐課程,爲了不你們被數學公式勸退,理論方面講的不是太深,科老師是兩度世界冠軍,說這是目前國內最好的強化學習實踐課
相關文章
相關標籤/搜索