深度強化學習入門

作者:清凇 (就職於阿里巴巴,搜索排序、自然語言處理) https://www.zhihu.com/people/huaqingsong 過去的一段時間在深度強化學習領域投入了不少精力,工作中也在應用DRL解決業務問題。子曰:溫故而知新,在進一步深入研究和應用DRL前,階段性的整理下相關知識點。本文集中在DRL的model-free方法的Value-based和Policy-base方法,詳細介紹
相關文章
相關標籤/搜索