AI芯片:深鑑科技基於深度壓縮的ESE方案分析

ESE 這篇論文,將之前介紹的韓鬆的Deep Compression技術在FPGA上具體實現。 爲了達到更高的效率,論文的設計從三個層次提高計算效率:算法優化,編譯高效的調度程序,硬件加速。如Figure 2所示。 論文設計的語音識別系統中,最佔用運算資源和存儲資源的是LSTM算法。故論文着重優化LSTM算法的計算。 LSTM算法的數據流如圖Figure 4所示。的確比較複雜。其中涉及到許多的矩陣
相關文章
相關標籤/搜索