強化學習各大算法詳細總結

時間 2021-01-13

原文原文鏈接

強化學習總結注：本文圖片均來自莫煩python或深入淺出強化學習原理入門，但我覺得小哥哥不是很理解，或者說講的不是讓人很懂，這裏我做一個比較細緻的論述一、強化學習概述強化學習是機器學習的一種，爲什麼這樣說，從Qlearning就可以看出來，你看，什麼時候Q（s,a）穩定啊，是不是當等於啊。所以這東西更新過程就是不斷地迭代Q（s,a）讓兩項接近，第一項我們稱Q現實，第二項稱Q估計，梯度下降如

>>阅读原文<<