主題模型探討

一)簡介 1.主題模型是對文本中隱含主題的一種建模方法;每個主題其實是詞表上單詞的概率分佈; 2.主題模型是一種生成模型,一篇文章的每個詞都是通過「以一定概率選擇了某個主題,並從這個主題中以一定概率選擇某個詞語」這樣一個過程得到的;   3.常見的主題模型有3種: (1)PLSA(Probabilistic Latent Semantic Analysis) (2)LDA(Latent Diric
相關文章
相關標籤/搜索