[論文解讀] DSD -- Dense-Sparse-Dense Training for Neural Network

《DSD: Dense-Sparse-Dense Training for Neural Network》發表在ICLR17, 這是一篇關注於提升模型訓練得到的準確率的文章,而不是一作傳統的研究領域:模型壓縮。 DSD是一種新的訓練模型的方式,可以提高預訓練模型的準確率。DSD和dropout不一樣,雖然都是在訓練過程中有prune(剪枝)操作,但是DSD是有一定依據來選擇去掉哪些connecti
相關文章
相關標籤/搜索