關於知識蒸餾,這三篇論文詳解不可錯過

做者 | 孟讓 git 轉載自知乎程序員 導語:繼《從Hinton開山之做開始,談知識蒸餾的最新進展》以後,做者對知識蒸餾相關重要進行了更加全面的總結。在上一篇文章中主要介紹了attention transfer,FSP matrix和DarkRank,關注點在於尋找不一樣形式的「知識」。網絡 本篇文章主要介紹17年圖森發佈的文章Neuron Selectivity Transfer,對Atten
相關文章
相關標籤/搜索