強化學習總結01 基本概念

時間 2021-01-15

標籤 Reinforcement Learning 简体版

原文原文鏈接

1. 概述強化學習是智能體（Agent）與環境（Environment）不斷交互, 不斷提高自己的決策能力的過程. 面向智能體的學習——通過與環境進行交互所學習的「樣本」來自於「與環境的交互」。而非像傳統機器學習的樣本是現有的。通過「試錯和優化」進行學習——用試錯後的獎勵（或懲罰）來學習「總體過程」：環境（Environment）會給智能體（Agent）一個觀測值（Observation

>>阅读原文<<