強化學習總結01 基本概念

1. 概述 強化學習是智能體(Agent)與環境(Environment)不斷交互, 不斷提高自己的決策能力的過程. 面向智能體的學習——通過與環境進行交互 所學習的「樣本」來自於「與環境的交互」。而非像傳統機器學習的樣本是現有的。 通過「試錯和優化」進行學習——用試錯後的獎勵(或懲罰) 來學習 「總體過程」:環境(Environment)會給智能體(Agent)一個觀測值(Observation
相關文章
相關標籤/搜索