IMPALA 分佈式框架 學習筆記

以下總結來源於:http://www.javashuo.com/article/p-peflmnno-ky.html IMPALA的靈感來自於熱門的A3C架構,後者使用多個分佈式actor來學習agent的參數。在類似這樣的模型中,每個actor都使用策略參數的一個副本,在環境中操作。actor會週期性地暫停探索,將它們已經計算得出的梯度信息分享至中央參數服務器,而後者會對此進行更新。 與此不同,
相關文章
相關標籤/搜索