TRAINED TERNARY QUANTIZATION 論文

時間 2020-12-20

標籤模型量化简体版

原文原文鏈接

本文是在TWQ(Ternary Weight Quantization)的基礎上做出的改進，其流程可以簡單概括爲：首先將全精度權重正則化到[-1,1]之間，然後根據一個每層相同的閾值delta_t來進行量化(這裏使用統一的t是爲了縮小搜索空間，用每個通道不同的t應該能得到更好的表現，但感覺會增加過多的計算消耗)爲-1，0和1， Ps：還提了第二種方法，見5.1.1，但論文裏沒有這一節。。。最

>>阅读原文<<