TRAINED TERNARY QUANTIZATION 論文

本文是在TWQ(Ternary Weight Quantization)的基礎上做出的改進,其流程可以簡單概括爲: 首先將全精度權重正則化到[-1,1]之間, 然後根據一個每層相同的閾值delta_t來進行量化(這裏使用統一的t是爲了縮小搜索空間,用每個通道不同的t應該能得到更好的表現,但感覺會增加過多的計算消耗)爲-1,0和1, Ps:還提了第二種方法,見5.1.1,但論文裏沒有這一節。。。 最
相關文章
相關標籤/搜索