pytorch量化中torch.quantize_per_tensor()函數參數詳解

torch.quantize_per_tensor(input,scale, zero_point, dtype)實現8位量化: 摘要:對該函數各個參數的分析 量化: 計算機運算時,默認32位浮點數,若將32位浮點數,變成8位定點數,會快很多。 目前pytorch中的反向傳播不支持量化,所以該量化只用於評估訓練好的模型,或者將32位浮點數模型存儲爲8位定點數模型,讀取8位定點數模型後需要轉換爲32
相關文章
相關標籤/搜索