機器學習--概率圖算法--主題模型算法理論

一 主題模型基礎認知 1 主題模型的概念 第一點:主題模型是生成式模型 一篇文章的每一個詞:文檔以一定概率選擇某個主題,並從這個主題中以一定概率選擇某個詞 第二點:主題模型的目的 主題模型可以自動分析每個文檔,統計文檔內詞語,根據統計的信息判斷當前文檔包含哪些主題以及這些主題所佔比例大小 2 主題模型的優點 第一點:克服了傳統信息檢索中文檔相似度計算的缺點(如詞袋法等忽略語義與語序問題) 第二點:
相關文章
相關標籤/搜索