強化學習方法彙總

本文轉自莫煩大佬 瞭解強化學習中常用到的幾種方法,以及他們的區別, 對我們根據特定問題選擇方法時很有幫助. 強化學習是一個大家族, 發展歷史也不短, 具有很多種不同方法. 比如說比較知名的控制方法Q learning, Policy Gradients, 還有基於對環境的理解的 model-based RL 等等. 接下來我們通過分類的方式來了解他們的區別. Model-free 和 Model-
相關文章
相關標籤/搜索