【強化學習】強化學習/加強學習/再勵學習介紹

Deepmind團隊在17年12月5日發佈的最新Alpha Zero中,很是重要的一種方法就是強化學習(reinforcement learning),又稱再勵學習、評價學習,是一種重要的機器學習方法,靠自身的經歷進行學習。經過這種方式,RLS在行動-評價的環境中得到知識,改進行動方案以適應環境。正由於能夠在小數據量的狀況下靠自身的行動得到經驗,因此Alpha Zero能夠經過自我對弈進行學習提升
相關文章
相關標籤/搜索