DeepRebirth: Accelerating Deep Neural Network Execution on Mobile Devices

DeepRebirth: Accelerating Deep Neural Network Execution on Mobile Devices 作者將CNN中的層分爲兩種:(1)Tensor Layer,如conv,fc;(2)Non-tensor Layer,如pooling,norm。作者發現網絡進行前向推理時,Non-tensor layer也會佔用不少時間和內存,作者提出用單獨的Ten
相關文章
相關標籤/搜索