Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference

摘要 作者提出了一種只使用整數運算的quantization方式,比起float point運算效率更高。同時提出了一種相應的訓練方式來保證quantization之後的準確率。這篇文章的方法提升了accuracy和on-device latency之間的trade off,並且可以在MobileNets上使用。 1 introduction 作者總結了目前有效將龐大的神經網絡應用在資源更爲有限的
相關文章
相關標籤/搜索