強化學習(一) - 基礎認知

強化學習 - 基礎認知 強化學習是想讓一個智能體(agent)在不一樣的環境狀態(state)下,學會選擇那個使得獎賞(reward)最大的動做(action)。html Agent在 t 時刻,經過觀測環境獲得本身所在的 狀態(state),接下來agent根據 策略(policy) 進行決策後,作出一個 動做(action)。這個action就會使得agent在 環境(environment)
相關文章
相關標籤/搜索