自然語言處理-LDA主題模型

一、LDA主題模型簡介 LDA(Latent Dirichlet Allocation)中文翻譯爲:潛在狄利克雷分佈。LDA主題模型是一種文檔生成模型,是一種非監督機器學習技術。它認爲一篇文檔是有多個主題的,而每個主題又對應着不同的詞。一篇文檔的構造過程,首先是以一定的概率選擇某個主題,然後再在這個主題下以一定的概率選出某一個詞,這樣就生成了這篇文檔的第一個詞。不斷重複這個過程,就生成了整篇文章(
相關文章
相關標籤/搜索