百度PaddlePaddle強化學習七日打卡營

時間 2021-01-10

標籤學習筆記強化學習简体版

原文原文鏈接

百度PaddlePaddle強化學習七日打卡營強化學習 Agent的兩種學習方案 PARL 強化學習MDP四元組 < S , A , P , R > <S,A,P,R> <S,A,P,R> 在線學習VS離線學習 Sarsa-learn函數離散動作VS連續動作 Policy-gradient DQN ![在這裏插入圖片描述](https://img-blog.csdnimg.cn/2020062

>>阅读原文<<