推出 Dreamer:使用世界模型的可擴展強化學習

文 / Google Research 學生研究員 Danijar Hafner 關於人工智能體如何選擇動作來實現目標的研究,目前進展迅速,這在很大程度上得益於強化學習 (RL) 的使用。無模型 (Model-free) 強化學習方法通過試錯來學習預測成功動作,讓 DeepMind 的 DQN 能夠玩 Atari 遊戲,也讓 AlphaStar 可以在星際爭霸 II(Starcraft II) 遊
相關文章
相關標籤/搜索