TF-IDF理論和實踐

TF-IDF是一種用於資訊檢索與資訊探勘的經常使用加權技術。TF-IDF是一種統計方法,用以評估一字詞對於一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現的次數成正比增長,但同時會隨著它在語料庫中出現的頻率成反比降低。TF-IDF加權的各類形式常被搜尋引擎應用,做爲文件與用戶查詢之間相關程度的度量或評級。除了TF-IDF之外,因特網上的搜尋引擎還會使用基於連結分析的
相關文章
相關標籤/搜索