論文總結:Quantizing deep convolutional networks for efficient inference: A whitepaper

論文地址:https://arxiv.org/pdf/1806.08342.pdf 主要內容 這篇論文是篇介紹量化的綜述,對量化的動機、方法等進行了較爲詳細的描述。 量化器的設計。作者介紹了三種量化方案:一致仿射量化器、均勻對稱量化器和隨機量化器。 模型量化的方法。大致可以分爲兩類:Post Training Quantization(訓練後量化)和 Quantization Aware Trai
相關文章
相關標籤/搜索