Multichannel Variable-Size Convolution for Sentence Classification(閱讀理解)

它結合了不同版本的預先訓練的詞嵌入 使用可變大小的卷積濾波器進行不同粒度的短語特徵提取 作者證明了使用預先訓練的網絡可以達到一個更好的結果 多通道輸入 作者將一小批量的句子整合成相同的長度,而對應通道的未知字將被隨機初始化,或者從下一節描述的互學習階段獲得良好的初始化,多通道輸入的好處是(1)一個頻繁的詞在開始時可以有多個表示(而不是隻有一個),這意味着它有更多可用的信息來利用(2)在一些word
相關文章
相關標籤/搜索