易用且靈活的 RWRL 套件，推動強化學習的現實應用

時間 2021-07-13

原文原文鏈接

文 / DeepMind 研究員 Daniel J. Mankowitz 和 Google Research 研究員 Gabriel Dulac-Arnold 實踐證明，強化學習 (Reinforcement Learning, RL) 可以有效應對從 Go、StarCraft 和 Minecraft 到機器人運動與芯片設計的衆多複雜問題。在這些情況下，人們可以使用仿真器或者通過快速訪問低成本的真

>>阅读原文<<