預訓練模型中的可插拔式知識融入-利用Adapter結構

這些天衝浪 🏄 了一下 Arxiv,粗翻了一下二月之後 public 的 NLP 文章(有很大一部分是準備投 ICML 的)。 也拜讀了 張馳原 dalao 的新作《Exploring the Memorization-Generalization Continuum in Deep Learning》. (實驗真的做的很漂亮,但感覺有點 data-special 不知道能不能推廣到 NLP)
相關文章
相關標籤/搜索