fpga 之cnn高效實現方式

  在fpga實現cnn中最重要的模塊部分-conv計算部分,可以稱爲是用fpga加速的根本。而計算最重要的關鍵則是如何充分利用fpga內的DSP,目前本人用的主要是ultrascale+,對應的dsp爲DSP48e2。 實現conv的兩種方式: (1)並行方式,目前大多數fpga的conv計算都不是採用的此種方式,簡單的說,如果要計算一個3*3的conv,則需要9個dsp,可以在一個時鐘內計算完
相關文章
相關標籤/搜索