LSTM 和GRU的區別

先給出一些結論: GRU和LSTM的性能在很多任務上不分伯仲。 GRU 參數更少因此更容易收斂,但是數據集很大的情況下,LSTM表達性能更好。 從結構上來說,GRU只有兩個門(update和reset),LSTM有三個門(forget,input,output),GRU直接將hidden state 傳給下一個單元,而LSTM則用memory cell 把hidden state 包裝起來。 1.
相關文章
相關標籤/搜索