LDA主題模型筆記

LDA圖模型 每一篇文檔代表了一些主題所構成的一個概率分佈,而每一個主題又代表了很多單詞所構成的一個概率分佈。如下圖: K爲主題個數,M爲文檔總數,是第m個文檔的單詞總數。 是每個Topic下詞的多項分佈的Dirichlet先驗參數,  是每個文檔下Topic的多項分佈的Dirichlet先驗參數。是第m個文檔中第n個詞的主題,是m個文檔中的第n個詞。剩下來的兩個隱含變量和分別表示第m個文檔下的T
相關文章
相關標籤/搜索