LDA主題模型

LDA(Latent Dirichlet Allocation)是一種文檔主題生成模型,這個模型包含了詞、主題和文檔三層結構。所謂的生成模型,就是說我們人爲一篇文章的每個詞都是通過 「以一定概率選擇了某個主題,並從這個主題中以一定的概率選擇某個詞語」 的這樣的一個過程得到的。其中,詞、主題和文檔的關係就是文檔到主題服從多項式分佈,主題到詞也服從多項式分佈。 首先,我們直觀地看一下 LDA 模型,比
相關文章
相關標籤/搜索