理解RNN的結構+特點+計算公式

引入 在某一些情況下,我們是無法使用標準的全連接神經網絡的。比如,預測句子中哪幾個單詞是人名,如果使用標準的全連接神經網絡,網絡結構如下: 如果使用這種結構,會存在兩個問題 輸入句子長度和輸出向量的維度,可能會不一樣。對不同的樣本,其輸入/輸出維度都不同。 當然你可以採用zero padding,將每個句子都填充到最大長度,但仍然不是一種很好的方式 改結構無法共享從文本不同位置上學到的特徵 舉例來
相關文章
相關標籤/搜索