【nlp論文筆記】 Glyce: Glyph-vectors for Chinese Character Representations

Abstract   本文貢獻: 我們使用中國歷史文字(如青銅器文字、篆書、繁體字等)來豐富文字的象形證據; 設計適合中文字符圖像處理的CNN結構(稱爲天澤-CNN); 將圖像分類作爲多任務學習的輔助任務,以提高模型的泛化能力。 作者表明,基於符號的模型能夠在廣泛的中文NLP任務中始終優於基於字/字符的模型。我們能夠爲各種中文NLP任務設置最新的結果,包括標記(NER、CWS、POS)、句子對分類
相關文章
相關標籤/搜索