別再蒸餾3層BERT了!變矮又能變瘦的DynaBERT瞭解一下

一隻小狐狸帶你解鎖煉丹術&NLP祕籍node 神經網絡模型除了部署在遠程服務器以外,也會部署在手機、音響等智能硬件上。好比在自動駕駛的場景下,大部分模型都得放在車上的終端裏,否則荒山野嶺沒有網的時候就尷尬了。對於BERT這類大模型來講,也有部署在終端的需求,但考慮到設備的運算速度和內存大小,是無法部署完整版的,必須對模型進行瘦身壓縮。git 說到模型壓縮,經常使用的方法有如下幾種:面試 量化:用F
相關文章
相關標籤/搜索