LDA主題模型

LDA主題模型 LDA是一種基於概率模型的主題模型算法(generative probabilistic model),用來識別大規模文檔集或者語料庫中隱含的主題信息。對於語料庫中的每篇文檔,LDA定義瞭如下生成過程: 對每一篇文檔,從主題分佈中抽一個主題 從上述被抽到的主題對應的單詞分佈中抽一個單詞 重複上述過程直至遍歷文檔中的每個詞 LDA認爲每篇文檔是多個主題混合而成,而每個主題可以由多個詞
相關文章
相關標籤/搜索