循環神經網絡層

Recap

42-循環神經網絡層-回顧.jpg

Sentiment Analysis

42-循環神經網絡層-情感分析.jpg

Proposal

42-循環神經網絡層-情感分析建議.jpg

  • Long sentence
    • 100 + words
    • too much parameters[\(w_N,b_N\)]
  • No context information
    • consistent tensor

S1.Weight sharing

  • 相似於卷積的卷積核,卷積視野,權重分享

42-循環神經網絡層-分享.jpg

Naive version

42-循環神經網絡層-情感分析建議.jpg

Weight share

  • 權重分享

42-循環神經網絡層-權重分享.jpg

S2.Consistent memory

  • 須要一個東西存儲語境,也就是每一個單詞的語境信息

42-循環神經網絡層-容器.jpg

  • 不斷地對語境信息進行堆疊獲得h5,直接使用h5做爲判斷標準

42-循環神經網絡層-內存分享.jpg

Unfolded model

42-循環神經網絡層-語境疊加.jpg

  • 在時間軸上摺疊,不斷地更新h

42-循環神經網絡層-摺疊.jpg

Formulation

  • 經過激活函數tanh不斷地疊加上個時間戳的信息

42-循環神經網絡層-數學公式.jpg

Overall Diagram

  • 全覽分解圖

42-循環神經網絡層-全覽分解.jpg

One more thing

42-循環神經網絡層-梯度.jpg

How to Train?

42-循環神經網絡層-訓練.jpg

相關文章
相關標籤/搜索