【強化學習】強化學習/加強學習/再勵學習介紹

時間 2019-12-05

標籤強化學習強化學習加強介紹简体版

原文原文鏈接

Deepmind團隊在17年12月5日發佈的最新Alpha Zero中，很是重要的一種方法就是強化學習(reinforcement learning)，又稱再勵學習、評價學習，是一種重要的機器學習方法，靠自身的經歷進行學習。經過這種方式，RLS在行動-評價的環境中得到知識，改進行動方案以適應環境。正由於能夠在小數據量的狀況下靠自身的行動得到經驗，因此Alpha Zero能夠經過自我對弈進行學習提升

>>阅读原文<<