加強學習、增量學習、遷移學習——概念性認知

時間 2020-01-16

標籤加強學習增量遷移概念性認知简体版

原文原文鏈接

1、加強學習/強化學習（Reinforcement Learning ）算法咱們老是給定一個樣本x，而後給或者不給label y。以後對樣本進行擬合、分類、聚類或者降維等操做。然而對於不少序列決策或者控制問題，很難有這麼規則的樣本。好比，四足機器人的控制問題，剛開始都不知道應該讓其動那條腿，在移動過程當中，也不知道怎麼讓機器人自動找到合適的前進方向。另外如要設計一個下象棋的AI，

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。