強化學習基礎知識

強化學習基礎知識 1. 概念 強化學習四要素:狀態(state)、動作(action)、策略(policy)、獎勵(reward)。 強化學習就是考慮的是智能體(Agent)與環境(Environment)的交互問題: 這裏是引用智能體處在一個環境中,每個狀態爲智能體對當前環境的感知;智能體只能通過動作來影響環境,當智能體執行一個動作後,會使得環境按某種概率轉移到另一個狀態;同時,環境會根據潛在的
相關文章
相關標籤/搜索