Deep Mutual Learning論文閱讀筆記

摘要 模型蒸餾是將知識從教師模型傳給學生模型有效且被廣泛使用的技術,典型的應用就是將一個很大並且能力很強的網絡中集成到一個比較小的網絡中,因爲小的網絡更加滿足低存儲和高效率的要求。在本文中,我們提出一種深度相互學習策略,在訓練的過程中學生網絡和教師網絡可以相互合作學習,而不是單方向的學生從教師那裏學習。我們的實驗表明各種網絡架構都能夠從相互學習策略中受益,並且在CIFAR-100和行人重識別數據集
相關文章
相關標籤/搜索