詞向量表示總結

1、Word2vec Skipgram總結: 存在缺點: (1) 可解釋性差 (2) 無法有效學習低頻詞向量 (3)上下文的考慮不多 (4) 窗口長度有限 (5) 無法考慮全局 (6) 嚴格意義的語序信息沒有學到 對應的解決模型: 對於低頻詞和未登錄詞的向量學習可用subword模型(但中文不好使,英文可以),即把一個單詞向量分解成子向量相加的形式, 計算出子單詞的向量表示,再用子單詞拼接成低頻詞
相關文章
相關標籤/搜索