2020李宏毅學習筆記——36.Network Compression(5_6)

5.Architecture Design Low Rank Approximation(低秩近似) 下圖是低秩近似的簡單示意圖,左邊是一個普通的全連接層,可以看到權重矩陣大小爲 M*N ,而低秩近似的原理就是在兩個全連接層之間再插入一層K。是不是很反直觀?插入一層後,參數還能變少**?** 沒錯,的確變少了,我們可以看看新插入一層後的參數數量爲: NK+KM=K*(M+N),因爲K<M,K<N,
相關文章
相關標籤/搜索