【面經】觸寶算法工程師一面

1. 項目介紹 項目大概介紹了半小時 結合項目提問 2. 問題 LSTM 爲什麼能解決梯度消失 答案:通俗地講:RNN中,每個記憶單元 h t − 1 h_{t-1} ht−1​都會乘上一個 W W W 和**函數的導數,這種連乘使得記憶衰減的很快,而LSTM是通過記憶和當前輸入"相加",使得之前的記憶會繼續存在而不是受到乘法的影響而部分「消失」,因此不會衰減。但是這種naive的做法太直白了,實
相關文章
相關標籤/搜索