OnRL: 基於在線強化學習的移動視頻傳輸優化

時間 2021-01-11

原文原文鏈接

從2019年開始，淘系技術部內容社交互動團隊和北京郵電大學周安福教授一起着手研究更好的基於機器學習的智能擁塞控制算法。在實驗室環境完成原型驗證後在淘寶直播的生產環境做實際效果對比，從實際數據來看效果明顯。我們將其中的技術要點和數據做了總結，並投稿MobiCom2020，非常幸運地被這家全球最頂級的計算機刊物錄用。以下是這篇Paper的中譯本。摘要機器學習模型，尤其是強化學習(RL)，在優化視頻

>>阅读原文<<