論文總結:Incremental Network Quantization

論文地址:https://arxiv.org/pdf/1702.03044.pdf 主要內容 作者提出了一種新的神經網絡量化方法——INQ,可以將訓練好的全精度的CNN模型轉換爲權重爲2的冪次方或0的低精度模型。INQ引入了三個操作:權重劃分、分組量化和再訓練。大致步驟爲通過某種策略(隨機劃分或剪枝啓發)將權重分爲不相交的兩組,先將第一組量化作爲低精度模型的基,而第二組用於補償量化帶來的精度損失,
相關文章
相關標籤/搜索