Model Compression and Acceleration Overview

模型壓縮、模型加速 模型壓縮方法: 能夠有效降低參數冗餘減少存儲佔用、通信帶寬、計算複雜度利部署 線性或非線性量化:1/2bits, int8 和 fp16等; 結構或非結構剪枝:deep compression, channel pruning 和 network slimming等; 網絡結構搜索 (NAS: Network Architecture Search):DARTS, DetNAS
相關文章
相關標籤/搜索