加強學習、增量學習、遷移學習——概念性認知

1、加強學習/強化學習(Reinforcement Learning )算法         咱們老是給定一個樣本x,而後給或者不給label y。以後對樣本進行擬合、分類、聚類或者降維等操做。然而對於不少序列決策或者控制問題,很難有這麼規則的樣本。好比,四足機器人的控制問題,剛開始都不知道應該讓其動那條腿,在移動過程當中,也不知道怎麼讓機器人自動找到合適的前進方向。另外如要設計一個下象棋的AI,
相關文章
相關標籤/搜索