【論文精讀】The Devil is the Classifier: Investigating Long Tail Relation Classification with Decoupling

這篇文章是浙江大學2020年9月15號推到Arxiv上的。 文章的初始出發點應該是來自,關係抽取數據集由於數據存在長尾特徵,因此直接從數據中學習語義,必定是不均衡的【樣本多的語義容易過擬合某個類別中的頭部樣本,樣本少的語義容易過擬合某個類別中的單個樣本】。 因此採用引入外部預訓練的詞向量來進行語義embedding就說得通。 同時又知道,我們有三種採樣的方式,來進行長尾數據集的再平衡,即將長尾數據
相關文章
相關標籤/搜索