RNN LSTM GRU Attention transformer公式整理總結(超詳細圖文公式)

整理各種模型的公式,以後面試複習用 RNN 公式: h t = f ( W ⋅ [ h t − 1 , x t ] + b ) h_{t}=f\left(W \cdot\left[h_{t-1}, x_{t}\right]+b\right) ht​=f(W⋅[ht−1​,xt​]+b) LSTM 公式: 遺忘門: f t = σ ( W f ⋅ [ h t − 1 , x t ] + b f )
相關文章
相關標籤/搜索