Quantization and Training of Neural Networks for Efﬁcient Integer-Arithmetic-Only Inference

時間 2020-12-20

原文原文鏈接

摘要作者提出了一種只使用整數運算的quantization方式，比起float point運算效率更高。同時提出了一種相應的訓練方式來保證quantization之後的準確率。這篇文章的方法提升了accuracy和on-device latency之間的trade off，並且可以在MobileNets上使用。 1 introduction 作者總結了目前有效將龐大的神經網絡應用在資源更爲有限的

>>阅读原文<<