從零實踐強化學習之連續動做空間上求解RL(PARL)

回顧這五節課的內容,其實能夠分紅四大內容:python 離散狀態空間 連續狀態空間 離散動做空間 連續狀態空間 最後一節課的主要內容就是學習用強化學習來求解連續狀態空間的問題web 連續動做空間 連續動做和離散動做是一個相對的概念,經過回顧離散動做來學習什麼是連續動做算法 連續動做 VS 離散動做 前面幾節課接觸到的,好比倒立擺、小烏龜還有雅達利的乒乓球,動做的步長都已經提早給定的,好比按一下就走
相關文章
相關標籤/搜索