TF-IDF

TF-IDF(term frequency–inverse document frequency)是一種用於信息檢索與數據挖掘的常用加權技術,常用於挖掘文章中的關鍵詞,而且算法簡單高效,常被工業用於最開始的文本數據清洗。 TF-IDF有兩層意思,一層是"詞頻"(Term Frequency,縮寫爲TF),另一層是"逆文檔頻率"(Inverse Document Frequency,縮寫爲IDF)。
相關文章
相關標籤/搜索