deep compression

時間 2020-12-23

原文原文鏈接

文章分三個步驟壓縮模型: Prunes the network：只保留一些重要的連接； Quantize the weights：通過權值量化來共享一些weights； Huffman coding：通過霍夫曼編碼進一步壓縮； 1.Prunes the network prunes的過程爲: 訓練一個網絡；把模型的權值矩陣weight的很小的值進行剪枝,方法是設定一個閾值,權值小於該閾值的值爲0