自然語言處理(4)

1. TF-IDF原理 1.1 什麼是TF-IDF? TF-IDF是一種統計方法,用以評估一字詞對於一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨着它在文件中出現的次數成正比增加,但同時會隨着它在語料庫中出現的頻率成反比下降。 TF-IDF加權的各種形式常被搜尋引擎應用,作爲文件與用戶查詢之間相關程度的度量或評級。 TF-IDF有兩層意思,一層是"詞頻"(Term Frequen
相關文章
相關標籤/搜索