Training with Quantization Noise for Extreme Model Compression

https://arxiv.org/pdf/2004.07320.pdf 論文的核心思想如下: 針對上圖進行實例分析: 如對卷積層weight爲(64,64,3,3)進行量化 設置centroids數目如(32,9)其中9表示3*3卷積核的flatten 通過k-means進行選取centroids 之後進行編碼(codebook),生成三個矩陣: centroids=(32,9) assignm
相關文章
相關標籤/搜索