強化學習實驗

強化學習之Q學習實驗描述 一.強化學習簡介 強化學習是一類特殊的機器學習算法,它借鑑於行爲主義心理學。算法要解決的問題是智能體在環境中怎樣執行動作以獲得最大的累計獎勵。 圖1. 強化學習的基本原理 智能體是強化學習中的動作實體,對於自動駕駛的汽車,環境是當前的路況。在每個時刻智能體和環境有自己的狀態,如汽車當前位置和速度,路面上的車輛和行人情況。智能體根據當前狀態確定一個動作,並執行該動作。之後它
相關文章
相關標籤/搜索