神經網絡模型壓縮瞎總結

模型壓縮整體思路離不開兩個方向,一是以剪枝,量化編碼爲表明的方法。將權重低於某一閾值的權重減去,即設置爲0,配合上L1正則化,很容易將模型稀疏,但剪枝操做只是把小權重設置爲0,網絡變得稀疏,要想加快網絡運算,須要設定必定的算法,跳過這些0值的運算,這部分便是稀疏矩陣的高效運算內容了。模型壓縮的另外一思路就是在網絡的通道上進行壓縮,以SqueezeNet,MobileNet,ShuffleNet等爲
相關文章
相關標籤/搜索