中科院自動化所介紹深度強化學習進展：從AlphaGo到AlphaGo Zero

時間 2021-01-12

原文原文鏈接

來源：德先生概要：2016年初，AlphaGo戰勝李世石成爲人工智能的里程碑事件。其核心技術深度強化學習受到人們的廣泛關注和研究，取得了豐碩的理論和應用成果。深度強化學習進展: 從AlphaGo到AlphaGo Zero 唐振韜, 邵坤, 趙冬斌 , 朱圓恆中國科學院自動化研究所複雜系統管理與控制國家重點實驗室, 北京 100190 中國科學院大學, 北京 100190 摘要: 201

>>阅读原文<<