如何提高強化學習的可靠性？

時間 2020-12-30

原文原文鏈接

https://www.toutiao.com/a6700314150565839368/ 來自網絡強化學習（RL）就像攀登1000米高的岩石表面一樣，需要學習如何做出連續的決定。RL的潛在應用範圍很廣，包括機器人(無人機控制)、對話系統(個人助理、自動呼叫中心)、遊戲產業(非玩家角色、計算機人工智能)、治療設計(藥物測試、作物管理)、複雜系統控制(資源分配、流程優化)等等。已經有一些RL

>>阅读原文<<