【RL從入門到放棄】【二十五】

一直在糾結強化學習的env環節,今天來看看google團隊提供的horizen: 今日,Facebook 開源了適合大規模產品和服務的強化學習平臺 Horizon,這是第一個使用強化學習在大規模生產環境中優化系統的開源端到端平臺。Horizon 包含的工作流程和算法建立在開放的框架上(PyTorch 1.0、Caffe2、Spark),任何使用 RL 的人都可以訪問 Horizon。去年,Face
相關文章
相關標籤/搜索