機器學習主題模型之LSA、pLSA、NMF

  1、主題模型(Topic Model)算法         判斷文檔類似性的傳統方法是經過查看兩個文檔共同出現的詞項(terms,不重複的words)有多少,如TF-IDF等。但這種方法沒有考慮到文字背後的語義關聯,可能在兩個文檔共同出現的詞項不多甚至沒有,但兩個文檔是類似的。dom         主題模型是用來在大量文檔中發現潛在主題的一種統計模型。若是一篇文章有一箇中心思想,那麼一些特定
相關文章
相關標籤/搜索