LSTM訓練無法收斂

LSTM不收斂問題 問題描述 我準備用LSTM建立一個關於時序數據的映射問題,簡單點來說就是輸入一段有序的數據,經過LSTM之後輸出另一段有序的數據,例如輸入一段行走的動畫骨架數據,輸出一段跑的骨架數據。 我的方法 使用了三層的LSTM,將走的數據當作輸入,跑的數據當做標籤,將網絡輸出的結果和我的標籤數據進行對比(使用了MSE損失函數),然後反向傳播改進網絡。 我的問題 網絡不收斂,損失函數下降到
相關文章
相關標籤/搜索