強化學習(Q-Learning,Sarsa)

Reinforcement Learning 監督學習–>非監督學習–>強化學習。html 監督學習:擁有「標籤」可監督算法不斷調整模型,獲得輸入與輸出的映射函數。 非監督學習:無「標籤」,經過分析數據自己進行建模,發掘底層信息和隱藏結構。 在線學習:接受新數據,更新參數。web 可是1.標籤須要花大量的代價進行收集,在有些狀況如子任務的組合數特別巨大尋找監督項是不切實際的。2.如何更好的理解數據
相關文章
相關標籤/搜索