深度學習FPGA實現的階段性總結

 最近做了CNN的卷積層和LS-SVM在ZYNQ7020上的實現。除了輸入是由ARM通過AXI總線傳輸,算法的主要部分都是由PL部分(FPGA)實現的。當然這只是入門的嘗試,對於一個深度學習算法,如何在硬件上實現效率最高,還需要進一步的驗證(在SOC架構中對算法進行劃分還是直接採用高端FPGA實現)。        最開始做的是卷積層的實現,通過學習的例程,使我對整個開發流程有了初步的認識。隨
相關文章
相關標籤/搜索