如何提高強化學習的可靠性?

https://www.toutiao.com/a6700314150565839368/   來自網絡 強化學習(RL)就像攀登1000米高的岩石表面一樣,需要學習如何做出連續的決定。RL的潛在應用範圍很廣,包括機器人(無人機控制)、對話系統(個人助理、自動呼叫中心)、遊戲產業(非玩家角色、計算機人工智能)、治療設計(藥物測試、作物管理)、複雜系統控制(資源分配、流程優化)等等。 已經有一些RL
相關文章
相關標籤/搜索