強化學習總結——對於離散空間

時間 2020-12-30

原文原文鏈接

什麼是強化學習？強化學習（reinforcement learning）是一種重要的機器學習方法。所謂強化學習就是智能體從環境到行爲映射的學習，目標是最大化期望積累獎勵。強化學習廣泛應用於無人駕駛汽車，棋類遊戲和機器人等領域當中。強化學習不屬於監督學習，也不屬於非監督學習。基本概念階段性任務：智能體與環境的互動在一個特定的時間步T結束連續性任務：智能體一直與環境互動沒有限制強化學習目標：

>>阅读原文<<