深度學習筆記——理論與推導之Reinforcement Learning（十三）

時間 2021-01-12

標籤深度學習简体版

原文原文鏈接

Reinforcement Learning（強化學習） Reinforcement Learning 機器學習的分支：有監督學習是機器學習任務的一種，它從有標記的訓練數據中推導出預測函數。有標記的訓練數據是指每個訓練實例都包括輸入和期望的輸出。即：給定數據，預測標籤。無監督學習是機器學習任務的一種，它從無標記的訓練數據中推斷結論。最典型的無監督學習就是聚類分析，它可以在探索性數據分析階段用於

>>阅读原文<<