大數據中的一些名詞

TF(Term Frequency) 表示某個關鍵詞在整篇文章中出現的頻率。web IDF(InversDocument Frequency) 表示計算倒文本頻率。文本頻率是指某個關鍵詞在整個語料全部文章中出現的次數。倒文檔頻率又稱爲逆文檔頻率,它是文檔頻率的倒數,主要用於下降全部文檔中一些常見卻對文檔影響不大的詞語的做用。分佈式 HDFS(Hadoop Distributed File Syst
相關文章
相關標籤/搜索