LSTM模型的兩種分解技巧

介紹 LSTM模型在語言模型,機器翻譯等領域取得了非凡的成就,然後LSTM網絡有幾百萬的參數以及需要數週在多GPU系統中進行訓練。因此,一下介紹兩種方法來縮減網絡參數以及訓練時間。兩種方法分別爲factorized LSTM(FLSTM)以及group LSTM(GLSTM)。 FLSTM FLSTM網絡主要是將大的LSTM矩陣轉化爲兩個小的矩陣。 LSTM模型簡單介紹 在LSTM網絡中, 其中
相關文章
相關標籤/搜索