谷歌、DeepMind強強聯手再發布Dreamer:性能遠超「前輩」PlaNet

2020-03-20 10:55:45   文 | 谷歌 AI 譯 | 叢末   去年,谷歌、DeepMind聯手推出基於模型的強化學習智能體PlaNet,能解決各種基於圖像的控制任務,性能可媲美當時最先進的無模型智能體,並且在數據效率上提升50倍,爲強化學習帶來了新的突破。 然而,該智能體依舊受到無效或計算成本高昂的規劃機制的侷限性。 現在,谷歌、DeepMind再度強強聯手推出了同爲基於模型的
相關文章
相關標籤/搜索