論文筆記:An Efficient Hardware Accelerator for Sparse Convolutional Neural Networks on FPGAs

Abstract 深度卷積神經網絡(CNN)以巨大的計算爲代價取得了卓越的性能。隨着CNN模型變得越來越複雜和深入,通過剪枝網絡中的冗餘連接來壓縮CNN以使其稀疏已成爲一種吸引人的方法,可以減少計算量和內存需求。另一方面,FPGA被證明是加速CNN推理的有效硬件平臺。但是,大多數現有的FPGA體系結構都集中在密集的CNN模型上。當執行稀疏模型時,這些密集的體系結構效率低下,因爲大多數算術運算都涉及
相關文章
相關標籤/搜索