Correlation Congruence for Knowledge Distillation

Motivation 目前大多數KD框架的pipeline 一張圖片送入teacher和student得到各自的feature和output 然後定義loss,拉進feature或者output的距離 但是他們都是直接在一個整圖級別上做的,student很難學習到teacher的那種處理類內和類間的能力 如下圖:白色空心圈是期望學習到的效果 左邊是期望類間可以拉開,右邊是期望類內可以聚攏 Meth
相關文章
相關標籤/搜索