NLP----關鍵詞提取算法(TextRank,TF/IDF)

參考書目:python天然語言處理實戰——核心技術與算法python TF/IDF 基本思想:TF是計算一個詞在一篇文檔中出現的頻率,IDF是一個詞在多少篇文檔中出現過,顯然TF越高證實這個詞在這篇文章中的表明性就越強,而INF越低則證實這個詞在具備越強的區分能力。所以中和這兩個數,就能較好地算出文檔的關鍵詞。算法 關鍵公式app |D_i|是文檔中出現詞i的文檔數量,|D|是文檔數編碼 附上書上
相關文章
相關標籤/搜索