只需一個損失函數,一個超參數即可壓縮BERT,MSRA提模型壓縮新方法

2020-03-13 14:37:47 機器之心報道 參與:魔王 來自武漢大學、北京航空航天大學和微軟亞洲研究院的這項研究爲模型壓縮提供了新方向。     論文鏈接:https://arxiv.org/pdf/2002.02925.pdf 這篇論文提出了一種新型模型壓縮方法,能夠通過逐步模塊替換(progressive module replacing)有效地壓縮 BERT。該方法首先將原版 BE
相關文章
相關標籤/搜索