強化學習（Q-Learning，Sarsa）

時間 2020-05-23

標籤強化學習 learning sarsa 简体版

原文原文鏈接

Reinforcement Learning 監督學習–>非監督學習–>強化學習。html 監督學習：擁有「標籤」可監督算法不斷調整模型，獲得輸入與輸出的映射函數。非監督學習：無「標籤」，經過分析數據自己進行建模，發掘底層信息和隱藏結構。在線學習：接受新數據，更新參數。web 可是1.標籤須要花大量的代價進行收集，在有些狀況如子任務的組合數特別巨大尋找監督項是不切實際的。2.如何更好的理解數據

>>阅读原文<<