WWW 2020 | 信息檢索中基於上下文的文本詞項權重生成

©PaperWeekly 原創 · 作者|金金 單位|阿里巴巴研究實習生 研究方向|推薦系統 本文由卡耐基梅隆大學發表於 WWW 2020,介紹了基於上下文的文本詞項權重生成方法 HDCT。原有的搜索引擎在使用詞袋模型表示文本時,性能受限於基於詞頻(term frequence)的詞項權重,HDCT 可以生成基於上下文的詞項權重作爲優化方案,該研究對 BM25 等初步檢索(first stage)
相關文章
相關標籤/搜索