增強學習（Reinforcement Learning and Control）

時間 2020-12-30

標籤 Machine Learning 简体版

原文原文鏈接

原文地址爲：增強學習（Reinforcement Learning and Control） [pdf版本]增強學習.pdf 在之前的討論中，我們總是給定一個樣本x，然後給或者不給label y。之後對樣本進行擬合、分類、聚類或者降維等操作。然而對於很多序列決策或者控制問題，很難有這麼規則的樣本。比如，四足機器人的控制問題，剛開始都不知道應該讓其動那條腿，在移動過程中，也不知道怎麼讓

>>阅读原文<<