Preparing Lessons: Improve Knowledge Distillation with Better Supervision論文筆記

論文地址:http://arxiv.org/abs/1911.07471 github地址:無 本文提出兩種監督方式來提高知識蒸餾的效果,旨在解決teacher網絡出現錯分類結果和模糊分類結果時的蒸餾問題,保證student網絡始終學習到有效的知識。 Methods Bad phenomenon 1:Genetic errors 含義:學生網絡和教師網絡都得到相同錯誤的預測結果,當教師網絡預測錯時
相關文章
相關標籤/搜索