強化學習:邁向知行合一的智能機制與算法

引用:王飛躍,曹東璞,魏慶來    http://blog.sciencenet.cn/blog-2374-1246976.html 摘要 簡要地評論了強化學習的歷史、現狀與未來的發展途徑,認爲強化學習應從先行後知、先知後行向知行合一的平行強化學習邁進,實現在虛擬世界「吃一塹」,在物理世界「長一智」,真正成爲智慧機制和智能算法的基礎學習理論。   關鍵詞: 強化學習 ; 動態規劃 ; 深度學習 ;
相關文章
相關標籤/搜索