亞馬遜:我們提取了BERT的一個最優子架構,只有Bert-large的16%,CPU推理速度提升7倍...

選自arXiv 作者:Adrian de Wynter、Daniel J. Perry 機器之心編譯 機器之心編輯部 提取 BERT 子架構是一個非常值得探討的問題,但現有的研究在子架構準確率和選擇方面存在不足。近日,來自亞馬遜 Alexa 團隊的研究者細化 BERT 子架構提取過程,並提取了一個最優子架構 Bort,它的大小僅爲 BERT-large 的 16%,CPU 上的推理速度卻提升到了原
相關文章
相關標籤/搜索