LSTM模型的兩種分解技巧

介紹 LSTM模型在語言模型,機器翻譯等領域取得了非凡的成就,而後LSTM網絡有幾百萬的參數以及須要數週在多GPU系統中進行訓練。所以,一下介紹兩種方法來縮減網絡參數以及訓練時間。兩種方法分別爲factorized LSTM(FLSTM)以及group LSTM(GLSTM)。git FLSTM FLSTM網絡主要是將大的LSTM矩陣轉化爲兩個小的矩陣。github LSTM模型簡單介紹 在LST
相關文章
相關標籤/搜索