論文筆記：Enhancing Pre-trained Chinese Character Representation with Word-aligned Attention

時間 2021-01-07

標籤自然語言處理人工智能深度學習算法 nlp 欄目 Microsoft Office 简体版

原文原文鏈接

1. 概述目前，很多NLP算法大多采用主流的預訓練模型+下游任務微調這樣的算法架構。預訓練模型種類繁多，如下圖用的最多的莫過於大名鼎鼎的BERT預訓練模型，同樣是基於Pre-training和Fine-tuning模式架構的不管啥模型，第一件事都是 tokenizer。對於 BERT 來說，英文的 token 是 word-piece，中文的是字（這也對後面的實驗造成了很大的麻煩，因爲要對齊

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。