推出 Dreamer：使用世界模型的可擴展強化學習

時間 2021-01-15

原文原文鏈接

文 / Google Research 學生研究員 Danijar Hafner 關於人工智能體如何選擇動作來實現目標的研究，目前進展迅速，這在很大程度上得益於強化學習 (RL) 的使用。無模型 (Model-free) 強化學習方法通過試錯來學習預測成功動作，讓 DeepMind 的 DQN 能夠玩 Atari 遊戲，也讓 AlphaStar 可以在星際爭霸 II(Starcraft II) 遊

>>阅读原文<<