模型壓縮一半,精度幾乎無損,TensorFlow推出半精度浮點量化工具包,還有在線Demo...

魚羊 發自 凹非寺  量子位 報道 | 公衆號 QbitAI 近日,TensorFlow模型優化工具包又添一員大將,訓練後的半精度浮點量化(float16 quantization)工具。python 有了它,就能在幾乎不損失模型精度的狀況下,將模型壓縮至一半大小,還能改善CPU和硬件加速器延遲。git 這一套工具囊括混合量化,全整數量化和修剪。github 如何量化模型,儘可任君挑選。小程序 壓
相關文章
相關標籤/搜索