預訓練語言模型 | (3) Bert

時間 2021-01-09

標籤預訓練語言模型简体版

原文原文鏈接

目錄 1. 背景 2. Bert流程和技術細節 3. 總結 1. 背景在bert之前，將預訓練的embedding應用到下游任務的方式大致可以分爲2種，一種是feature-based，例如ELMo這種將經過預訓練的embedding作爲特徵引入到下游任務的網絡中；一種是fine-tuning，例如GPT這種將下游任務接到預訓練模型上，然後一起訓練。然而這2種方式都會面臨同一個問題，就是無法直接

>>阅读原文<<