強化學習之概述

什麼是強化學習? 面向智能體的學習–經過與一個環境進行交互來實現目標 經過試錯和優化進行學習–用試錯後的獎勵(或懲罰)進行學習 強化學習 vs 其餘機器學習 機器學習web 監督學習:有即時標籤的學習(如分類,迴歸等)機器學習 監督學習要求帶標籤的數據,這些數據是比較昂貴的 標註數據也是一門學問svg 非監督學習:無標籤學習(聚類問題等)函數 無標籤數據的數量很是龐大且容易得到學習 強化學習:有延
相關文章
相關標籤/搜索