基於FPGA的CNN算法移植(二)硬件架構

更多精彩內容,請微信搜索「FPGAer俱樂部」關注我們 這次我們來談談硬件架構,其實沒啥好說的,就是科普的東西。因爲這個玩意兒真的沒啥新意         第一款:google的TPU 架構 圖中DDR3僅僅是用來傳送數據量小的權重,因爲DDR3的速度實在是跟不上啊。而**值採用167GiB/S 的速度傳入和傳出,中間那個矩陣乘法器是65536個 ,運算力相當野蠻吧。中間就是一些控制邏輯——不同層
相關文章
相關標籤/搜索