TF-IDF與餘弦相似性的應用(三):自動摘要

有時候,很簡單的數學方法,就可以完成很複雜的任務。 這個系列的前兩部分就是很好的例子。僅僅依靠統計詞頻,就能找出關鍵詞和相似文章。雖然它們算不上效果最好的方法,但肯定是最簡便易行的方法。今天,依然繼續這個主題。討論如何通過詞頻,對文章進行自動摘要(Automatic summarization)。         如果能從3000字的文章,提煉出150字的摘要,就可以爲讀者節省大量閱讀時間。由人完
相關文章
相關標籤/搜索