強化學習總結——對於離散空間

什麼是強化學習? 強化學習(reinforcement learning)是一種重要的機器學習方法。所謂強化學習就是智能體從環境到行爲映射的學習,目標是最大化期望積累獎勵。強化學習廣泛應用於無人駕駛汽車,棋類遊戲和機器人等領域當中。強化學習不屬於監督學習,也不屬於非監督學習。 基本概念 階段性任務:智能體與環境的互動在一個特定的時間步T結束 連續性任務:智能體一直與環境互動沒有限制 強化學習目標:
相關文章
相關標籤/搜索