論文筆記：Quantizing deep convolutional networks for efficient inference: A whitepaper

時間 2020-12-30

原文原文鏈接

地址：https://arxiv.org/abs/1806.08342 這篇白皮書統一介紹了當前將網絡進行定點化的方法。下面將看到的重點記錄下來。爲了降低深度神經網絡的計算量以及帶寬（內存佔用量），一種簡單可行的方式就是將浮點網絡（網絡權重都是float類型數值）轉換成定點網絡（網絡權重都是或者部分是int8類型）具體來說，這麼做的優勢在於：不用改變網絡結構，不用重新訓練單個int8定點數的