《強化學習》基礎知識(一)

強化學習解決什麼問題 ⼀句話概括強化學習能解決的問題:序貫決策問題。 強化學習如何解決問題,和監督學習的區別 與之相對的是監督學習,監督學習解決的是智能感知的問題。比如手寫體數字識別,通過多樣化的標籤數據來訓練智能體,讓智能體學習到輸入樣本的抽象特徵並分類。 強化學習要解決序貫決策問題,不關心輸入長什麼樣,只關心當前狀態下應該採取什麼動作才能實現最終的目標,即讓整個任務序列達到最優。智能體通過動作
相關文章
相關標籤/搜索