論文筆記:Quantizing deep convolutional networks for efficient inference: A whitepaper

地址:https://arxiv.org/abs/1806.08342 這篇白皮書統一介紹了當前將網絡進行定點化的方法。下面將看到的重點記錄下來。 爲了降低深度神經網絡的計算量以及帶寬(內存佔用量),一種簡單可行的方式就是將浮點網絡(網絡權重都是float類型數值)轉換成定點網絡(網絡權重都是或者部分是int8類型)具體來說,這麼做的優勢在於: 不用改變網絡結構,不用重新訓練 單個int8定點數的
相關文章
相關標籤/搜索