乾貨 | 算法工程師入門第二期——穆黎森講增強學習(二)

Beyond Deep Q Learning DQN將一個強大的工具deep neural network 引入RL,解決了這中間遇到的很多新問題,收到了很好的效果。自從這篇工作以後,一方面,大家希望更強的工具能解決更難的問題,比如上面DQN還玩的不是很好的遊戲,或者遊戲之外的問題;另一方面,大家也希望已經能夠解決的問題能做得更好,更快。近兩年,學術界和工業界做了很多工作,不斷將RL的效果和性能推
相關文章
相關標籤/搜索