Share:高性能深度學習支持引擎實戰——TensorRT

This artical introduce TensorRT : https://developer.aliyun.com/article/580307 總結一下推斷(Inference)和訓練(Training)的不同: 推斷(Inference)的網絡權值已經固定下來,無後向傳播過程,因此可以 1)模型固定,可以對計算圖進行優化 輸入輸出大小固定,可以做memory優化(注意:有一個概念是f
相關文章
相關標籤/搜索