《Clojure數據分析祕笈》——2.6節調整詞頻值的度量

本節書摘來自華章社區《Clojure數據分析祕笈》一書中的第5章,第2.6節調整詞頻值的度量,作者(美)Eric Rochester,更多章節內容可以訪問雲棲社區「華章社區」公衆號查看 2.6 調整詞頻值的度量 標準化數值的一種方式是根據組的大小來度量其頻率。例如,單詞truth在一個文檔中出現三次。如果這個文檔有30個單詞是一種意義,然而如果這個文檔有300個單詞或者3000個單詞就會有不同的意
相關文章
相關標籤/搜索