強化學習方法彙總

時間 2021-01-06

原文原文鏈接

本文轉自莫煩大佬瞭解強化學習中常用到的幾種方法,以及他們的區別, 對我們根據特定問題選擇方法時很有幫助. 強化學習是一個大家族, 發展歷史也不短, 具有很多種不同方法. 比如說比較知名的控制方法Q learning, Policy Gradients, 還有基於對環境的理解的 model-based RL 等等. 接下來我們通過分類的方式來了解他們的區別. Model-free 和 Model-

>>阅读原文<<