GRU與LSTM

1、前言 GRU是LSTM的一種變體,綜合來看: 一、二者的性能在不少任務上不分伯仲。 二、GRU 參數相對少更容易收斂,可是在數據集較大的狀況下,LSTM性能更好。 三、GRU只有兩個門(update和reset),LSTM有三個門(forget,input,output) LSTM還有許多變體,但無論是何種變體,都是對輸入和隱層狀態作一個線性映射後加非線性激活函數,重點在於額外的門控機制是如何
相關文章
相關標籤/搜索