Accelerating deep convolutional networks using low-precision and sparsity

時間 2021-07-12

原文原文鏈接

（這篇blog不涉及文中所探討的dLAC設計的內容）這篇文章旨在不影響其準確率的情況下提高deep CNN的計算效率。作者採用了兩種方法：1.使用2-bit代替原來的full precision進行訓練和inference；2.跳過過於zero value的計算。 1 low-precision deep CNN 作者使用了先前研究者提出的ternary network的框架，使用2-bit來訓

>>阅读原文<<