易用且靈活的 RWRL 套件,推動強化學習的現實應用

文 / DeepMind 研究員 Daniel J. Mankowitz 和 Google Research 研究員 Gabriel Dulac-Arnold 實踐證明,強化學習 (Reinforcement Learning, RL) 可以有效應對從 Go、StarCraft 和 Minecraft 到機器人運動與芯片設計的衆多複雜問題。在這些情況下,人們可以使用仿真器或者通過快速訪問低成本的真
相關文章
相關標籤/搜索