簡單的特徵值梯度剪枝,CPU和ARM上帶來4-5倍的訓練加速 | ECCV 2020

論文通過DBTD方法計算過濾閾值,再結合隨機剪枝算法對特徵值梯度進行裁剪,稀疏化特徵值梯度,能夠降低迴傳階段的計算量,在CPU和ARM上的訓練分別有3.99倍和5.92倍的加速效果   來源:曉飛的算法工程筆記 公衆號 論文: Accelerating CNN Training by Pruning Activation Gradients 論文地址:https://arxiv.org/abs/1
相關文章
相關標籤/搜索