自動文摘(Automatic document summarization)方法綜述(二)——基於最優化的(optimization-based)方法

在上一篇博客中,我總結了基於中心(centroid-based)的方法和基於圖(graph-based)方法。這兩類方法的重心都集中在給文本單元打分上,也就是判斷文本單元對原始文檔的覆蓋度(coverage)或者說文本單元與文檔主題的相關度(relevance),進而得到文本單元的重要性權重。這隻考慮了自動文摘的第一個要素,沒有考慮文本單元之間的相似度可能帶來的冗餘。一般來說,生成一份高質量的自動
相關文章
相關標籤/搜索