【論文閱讀筆記】Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference

該方法的簡稱爲:IAO   該論文提出了一種允許網絡在推測時只使用整數計算的方法,即 float32 --> int8.   該文在MobileNets等已經壓縮過的網絡進行量化,測試數據集爲ImageNet分類數據集。不同於其他的方法,在高度冗餘的模型,如Alexnet等網絡上進行的,且提出的硬件加速方法需要專門的特殊硬件(即他們並沒有在真正的硬件上加速,只是提出一種理論),該方法在普通的CPU
相關文章
相關標籤/搜索