機器學習主題模型之LDA概念

隱含狄利克雷分佈(Latent Dirichlet allocation)是一種生成式統計模型,是泛化的pLSA模型,區別在於LDA假設主題分佈是稀疏的Dirichlet prior,即所有文檔只覆蓋一小部分的主題,且這些主題只頻繁地使用一小部分的單詞。 LDA是三層貝葉斯模型,基於變分方法的近似推理和經驗貝葉斯參數估計的EM算法,使用「先驗分佈」和「數據對數似然」得出「後驗分佈」,再用後驗分佈作
相關文章
相關標籤/搜索