強化學習入門學習記錄

時間 2021-01-16

原文原文鏈接

最近學習了RL，感覺RL屬於機器學習中比較有意思的一個領域，監督學習、無監督學習都是扔一堆靜止的數據去訓練你的模型，而強化學習是讓模型與環境的交互中進行學習，讓人感覺更像一種有智慧的生物（然而並不是）。比如需要讓機器學會玩一個遊戲有兩種方法： 1. 有監督學習 (專家級玩家玩無數次，記錄下結果作爲有標記數據) 2. 強化學習強化學習是在與環境的交互中不斷得到反饋進行學習的，就像一個真實的生命

>>阅读原文<<