技能 | 三次簡化一張圖: 一招理解LSTM/GRU門控機制

​ 作者 | 張皓 引言 RNN是深度學習中用於處理時序數據的關鍵技術, 目前已在自然語言處理, 語音識別, 視頻識別等領域取得重要突破, 然而梯度消失現象制約着RNN的實際應用。LSTM和GRU是兩種目前廣爲使用的RNN變體,它們通過門控機制很大程度上緩解了RNN的梯度消失問題,但是它們的內部結構看上去十分複雜,使得初學者很難理解其中的原理所在。本文介紹」三次簡化一張圖」的方法,對LSTM和GR
相關文章
相關標籤/搜索