必須要GPT-3嗎?不,BERT的MLM模型也能小樣本學習

©PaperWeekly 原創 · 作者|蘇劍林 單位|追一科技 研究方向|NLP、神經網絡 大家都知道現在 GPT-3 風頭正盛,然而,到處都是 GPT-3、GPT-3 地推,讀者是否記得 GPT-3 論文的名字呢?事實上,GPT-3 的論文叫做 Language Models are Few-Shot Learners [1],標題裏邊已經沒有 G、P、T 幾個單詞了,只不過它跟開始的 GPT
相關文章
相關標籤/搜索