deep compression

文章分三個步驟壓縮模型: Prunes the network:只保留一些重要的連接; Quantize the weights:通過權值量化來共享一些weights; Huffman coding:通過霍夫曼編碼進一步壓縮; 1.Prunes the network prunes的過程爲: 訓練一個網絡; 把模型的權值矩陣weight的很小的值進行剪枝,方法是設定一個閾值,權值小於該閾值的值爲0
相關文章
相關標籤/搜索