deep compression:compressing deep neural networks with pruning,trained quantization and huffman codi

deep compression:compressing deep neural networks with pruning,trained quantization and huffman coding 摘要 神經網絡是計算密集型和內存密集型的,這使得它們很難部署在硬件資源有限的嵌入式系統上。爲了解決這個限制,我們引入了「深度壓縮」,這是一個三階段的管道:修剪、訓練量化和霍夫曼編碼,它們共同工作
相關文章
相關標籤/搜索