強化學習入門學習記錄

最近學習了RL, 感覺RL屬於機器學習中比較有意思的一個領域,監督學習、無監督學習都是扔一堆靜止的數據去訓練你的模型,而強化學習是讓模型與環境的交互中進行學習,讓人感覺更像一種有智慧的生物(然而並不是)。比如需要讓機器學會玩一個遊戲 有兩種方法: 1. 有監督學習 (專家級玩家玩無數次,記錄下結果作爲有標記數據) 2. 強化學習 強化學習是在與環境的交互中不斷得到反饋進行學習的,就像一個真實的生命
相關文章
相關標籤/搜索