看了這篇你還不懂BERT,那你就過來打死我吧

  目錄 1. Word Embedding. 1 1.1 基於共現矩陣的詞向量... 1 1.2 基於語言模型的詞向量... 2 2. RNN/LSTM/GRU.. 5 2.1 RNN.. 5 2.2 LSTM 通過門的機制來避免梯度消失... 6 2.3 GRU 把遺忘門和輸入門合併成一個更新門... 6 3. seq2seq模型... 8 3.1 樸素的seq2seq模型... 8 3.2
相關文章
相關標籤/搜索