【數據競賽】「達觀杯」文本智能處理挑戰賽2

一、什麼是TF-IDF:        TF-IDF(Term Frequency-Inverse DocumentFrequency, 詞頻-逆文件頻率),一種用於資訊檢索和資訊探勘的常用加權技術。        TF-IDF是一種統計方法,用以評估一字詞對於一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨着它在文件中出現的次數成正比增加,但同時會隨着它在語料庫中出現的頻率成反比
相關文章
相關標籤/搜索