深度學習筆記——理論與推導之Reinforcement Learning(十三)

Reinforcement Learning(強化學習) Reinforcement Learning 機器學習的分支: 有監督學習是機器學習任務的一種,它從有標記的訓練數據中推導出預測函數。有標記的訓練數據是指每個訓練實例都包括輸入和期望的輸出。即:給定數據,預測標籤。 無監督學習是機器學習任務的一種,它從無標記的訓練數據中推斷結論。最典型的無監督學習就是聚類分析,它可以在探索性數據分析階段用於
相關文章
相關標籤/搜索