pytorch量化中torch.quantize_per_tensor()函數參數詳解

時間 2021-01-16

標籤筆記機器學習 pytorch 深度學習简体版

原文原文鏈接

torch.quantize_per_tensor(input,scale, zero_point, dtype)實現8位量化：摘要：對該函數各個參數的分析量化：計算機運算時，默認32位浮點數，若將32位浮點數，變成8位定點數，會快很多。目前pytorch中的反向傳播不支持量化，所以該量化只用於評估訓練好的模型，或者將32位浮點數模型存儲爲8位定點數模型，讀取8位定點數模型後需要轉換爲32

>>阅读原文<<