手推公式:LSTM單元梯度的詳細的數學推導

長短時間記憶是複雜和先進的神經網絡結構的重要組成部分。本文的主要思想是解釋其背後的數學原理,因此閱讀本文以前,建議首先對LSTM有一些瞭解。web 介紹 上面是單個LSTM單元的圖表。我知道它看起來可怕😰,但咱們會經過一個接一個的文章,但願它會很清楚。網絡 解釋 基本上一個LSTM單元有4個不一樣的組件。忘記門、輸入門、輸出門和單元狀態。咱們將首先簡要討論這些部分的使用,而後深刻討論數學部分。s
相關文章
相關標籤/搜索