中科院自動化所介紹深度強化學習進展:從AlphaGo到AlphaGo Zero

來源:德先生 概要:2016年初,AlphaGo戰勝李世石成爲人工智能的里程碑事件。其核心技術深度強化學習受到人們的廣泛關注和研究,取得了豐碩的理論和應用成果。 深度強化學習進展:  從AlphaGo到AlphaGo Zero 唐振韜, 邵坤, 趙冬斌 , 朱圓恆 中國科學院 自動化研究所 複雜系統管理與控制國家重點實驗室, 北京 100190 中國科學院大學, 北京 100190 摘要: 201
相關文章
相關標籤/搜索