基於騰訊雲TKE的大規模強化學習實踐

| 導語 大規模的強化學習需要海量的異構計算資源,批量快速啓停訓練任務,高頻更新模型參數,跨機跨進程共享模型數據等。傳統的手工管理模式操作繁瑣,面臨諸多不確定性,帶來的各種挑戰無法支撐大規模強化學習的場景。本文介紹了騰訊內部某業務基於 TKE 構建大規模強化學習解決方案,以及與傳統手工模式對比該方案帶來的優勢。 一、項目挑戰 大規模的強化學習需要海量的異構計算資源,批量快速啓停訓練任務,高頻更新模
相關文章
相關標籤/搜索