當前深度神經網絡模型壓縮和加速方法速覽

「本文介紹的論文全面概述了深度神經網絡的壓縮方法,主要可分爲參數修剪與共享、低秩分解、遷移/壓縮卷積濾波器和知識精煉,本論文對每一類方法的性能、相關應用、優點和缺陷等進行獨到的分析。」 大型神經網絡具備大量的層級與結點,所以考慮如何減小它們所須要的內存與計算量就顯得極爲重要,特別是對於在線學習和增量學習等實時應用。此外,近來智能可穿戴設備的流行也爲研究員提供了在資源(內存、CPU、能耗和帶寬等)有
相關文章
相關標籤/搜索