完勝 BERT,谷歌最佳 NLP 預訓練模型開源

2020-03-16 19:35 導語:小模型高精度,效率顯著優於 MLM。 按:近日,谷歌宣佈將 AI 語言模型 ELECTRA 作爲 TensorFlow 之上的開源模型發佈。該方法用到了一種稱爲替換令牌檢測(RTD)的新預訓練任務,使其能夠在從所有輸入位置學習的同時,訓練雙向模型。 並且,在同等計算資源的情況下,ELECTRA 的性能優於現有方法;而在參數量只有 1/30 的情況下,取得不遜
相關文章
相關標籤/搜索