八千字長文深度解讀,遷移學習在強化學習中的應用及最新進展

機器之心原創git 做者:Luo Sainangithub 編輯:H4O算法 本文經機器之心受權轉載,禁止二次轉載跨域 遷移學習經過將源任務學習到的經驗應用到目標任務,從而讓目標任務的訓練更靈活高效,也更貼近現實狀況——每每要解決的目標問題可能很難直接學習,由於訓練數據不足或者沒法直接與環境交互難以得到訓練數據。所以將遷移學習應用到強化學習中,勢必能幫助強化學習更好地落地到實際問題。本文將從遷移學
相關文章
相關標籤/搜索