機器學習面試系列二

21.請大致對比下plsa和LDA的區別   pLSA中,主題分佈和詞分佈確定後,以一定的概率(、)分別選取具體的主題和詞項,生成好文檔。而後根據生成好的文檔反推其主題分佈、詞分佈時,最終用EM算法(極大似然估計思想)求解出了兩個未知但固定的參數的值:(由轉換而來)和(由轉換而來)。   文檔d產生主題z的概率,主題z產生單詞w的概率都是兩個固定的值。   舉個文檔d產生主題z的例子。給定一篇文檔
相關文章
相關標籤/搜索