深度強化學習入門

時間 2021-07-08

原文原文鏈接

作者：清凇（就職於阿里巴巴，搜索排序、自然語言處理） https://www.zhihu.com/people/huaqingsong 過去的一段時間在深度強化學習領域投入了不少精力，工作中也在應用DRL解決業務問題。子曰：溫故而知新，在進一步深入研究和應用DRL前，階段性的整理下相關知識點。本文集中在DRL的model-free方法的Value-based和Policy-base方法，詳細介紹

>>阅读原文<<