【深度強化學習】強化學習的基本概念

文章目錄 前言 第一章:強化學習的基本概念 學習——監督, 無監督與強化學習 強化學習的體系與聯繫 Reward 獎勵 Agent Environment Actions Observation 馬爾科夫決策過程 馬爾科夫鏈 馬爾科夫獎勵過程 馬爾科夫決策過程 Policy 總結 前言 重讀《Deep Reinforcemnet Learning Hands-on》, 常讀常新, 極其深入淺出的一
相關文章
相關標籤/搜索