【LDA】LDA主題模型

LDA是一個概率生成模型。認爲文檔是由詞袋中的詞按一定概率生成。對於語料集中的每篇文檔,其生成過程是: 首先,從文檔的所有主題分佈中選取一個主題,這個過程服從所有主題的多項式分佈。同時文檔所有主題服從Dirichlet分佈。 其次,從選取的主題中選取一個詞,這個過程也是服從多項式分佈。 重複上面的操作,這樣一篇文檔就生成了。再重複文檔的生成過程,一個文檔集也就生成。
相關文章
相關標籤/搜索