IMPALA 分佈式框架學習筆記

時間 2020-12-27

原文原文鏈接

以下總結來源於：http://www.javashuo.com/article/p-peflmnno-ky.html IMPALA的靈感來自於熱門的A3C架構，後者使用多個分佈式actor來學習agent的參數。在類似這樣的模型中，每個actor都使用策略參數的一個副本，在環境中操作。actor會週期性地暫停探索，將它們已經計算得出的梯度信息分享至中央參數服務器，而後者會對此進行更新。與此不同，

>>阅读原文<<