通俗的說 LDA ----Latent Dirichlet Allocation

LDA的原理: LDA(Latent Dirichlet Allocation)是一種文檔主題生成模型,也稱爲一個三層貝葉斯概率模型,包含詞、主題和文檔三層結構。所謂生成模型,就是說,我們認爲一篇文章的每個詞都是通過「以一定概率選擇了某個主題,並從這個主題中以一定概率選擇某個詞語」這樣一個過程得到。文檔到主題服從多項式分佈,主題到詞服從多項式分佈。 什麼是主題 因爲LDA是一種主題模型,那麼首先必
相關文章
相關標籤/搜索