增強學習(Reinforcement Learning and Control)

原文地址爲: 增強學習(Reinforcement Learning and Control)  [pdf版本]增強學習.pdf      在之前的討論中,我們總是給定一個樣本x,然後給或者不給label y。之後對樣本進行擬合、分類、聚類或者降維等操作。然而對於很多序列決策或者控制問題,很難有這麼規則的樣本。比如,四足機器人的控制問題,剛開始都不知道應該讓其動那條腿,在移動過程中,也不知道怎麼讓
相關文章
相關標籤/搜索