Accelerating deep convolutional networks using low-precision and sparsity

(這篇blog不涉及文中所探討的dLAC設計的內容) 這篇文章旨在不影響其準確率的情況下提高deep CNN的計算效率。作者採用了兩種方法:1.使用2-bit代替原來的full precision進行訓練和inference;2.跳過過於zero value的計算。 1 low-precision deep CNN 作者使用了先前研究者提出的ternary network的框架,使用2-bit來訓
相關文章
相關標籤/搜索