深度學習計算框架綜述(八)並行計算優化思想

本章主要介紹,不一樣處理器,CPU、GPU、DSP如何作並行計算加速,這要求咱們掌握不一樣處理器的硬件特性,如寄存器的尺寸和個數、Cache的大小,還有指令支持,這些都是計算優化中很重要的影響因素,同時須要學習Neon、OpenCL、OpenGL、HVX編程,此外,對於DSP,咱們還須要掌握量化算法。下面咱們就按照CPU、GPU、DSP的順序來介紹優化思想。算法
相關文章
相關標籤/搜索