11.主題模型概述(PLSA+LDA)

1.引出主題模型 對於文本分類的問題出現了「一詞多義」,「多詞一義」,樸素貝葉斯無法解決! 針對此,引出主題這個概念,通過主題,可以把一個詞映射到多個主題中,可以把多個詞映射到一個主題中去! ps:通過主題這個隱變量,來改善現存的問題! 2.主題模型之pLSA(EM算法的應用) 1.選定文檔  2.通過文檔選定主題   3.通過主題選定詞 ps:主要流程就是通過文檔選擇一個主題,根據主題來進行詞的
相關文章
相關標籤/搜索