MATLAB強化學習工具箱(十二)強化學習智能體創建總覽

強化學習智能體創建總覽 強化學習介紹 內置智能體 選擇智能體類型 自定義智能體 關於強化學習的更多介紹 強化學習介紹 強化學習的目標是訓練智能體在不確定的環境中完成任務。智能體從環境中接收觀察和獎勵,並向環境發送操作。獎勵是衡量某個動作相對於完成任務目標的成功程度的指標。該智能體包含兩個組件:策略和學習算法。 該策略是一種映射,它根據對環境的觀察來選擇操作。通常,策略是帶有可調參數的函數逼近器,例
相關文章
相關標籤/搜索