6、摘要提取算法

目前主要方法有: 基於統計:統計詞頻,位置等信息,計算句子權值,再簡選取權值高的句子作爲文摘,特點:簡單易用,但對詞句的使用大多僅停留在表面信息。 基於圖模型:構建拓撲結構圖,對詞句進行排序。例如,TextRank/LexRank 基於潛在語義:使用主題模型,挖掘詞句隱藏信息。例如,採用LDA,HMM 基於整數規劃:將文摘問題轉爲整數線性規劃,求全局最優解。 TextRank 算法是一種用於文本的
相關文章
相關標籤/搜索