乾貨|基於CPU的深度學習推理部署優化實踐

背景介紹 隨着人工智能技術在愛奇藝視頻業務線的廣泛應用,深度學習算法在雲端的部署對計算資源,尤其是 GPU 資源的需求也在飛速增長。如何提高深度學習應用部署效率,降低雲平臺運行成本,幫助算法及業務團隊快速落地應用和服務,讓 AI 發揮真正的生產力,是深度學習雲平臺團隊努力的目標 。 從基礎架構的角度,GPU資源的緊缺和GPU 利用率的不足是我們面臨的主要挑戰。由於大量的算法訓練及推理服務需求,雲端
相關文章
相關標籤/搜索