百度NLP:強化學習之原理與應用

強化學習之原理與應用 強化學習特別是深度強化學習近年來取得了令人矚目的成就,除了應用於模擬器和遊戲領域,在工業領域也正取得長足的進步。 百度是較早佈局強化學習的公司之一。這篇文章系統地介紹強化學習算法基礎知識,強化學習在百度的應用,以及百度近期發佈的強化學習工具PARL。 強化學習算法 強化學習(RL)和其他學習方法的異同 首先,從宏觀層面看,可以通過「三軸」圖來看強化學習與其他學習方法的聯繫和區
相關文章
相關標籤/搜索