MIX理解

2018年的MIX的網絡結構,如下: 提取特徵(如n-gram,pos等) 採用多通道和注意力機制,得到特徵 其中拿tfidf對詞權重初始化 其中使用3D卷積核提取,這裏與CV理論一致。所以這裏可以探討是否可以利用殘差等進行優化第三部分。 效果評測
相關文章
相關標籤/搜索