看不懂打死我係列——主題模型pLSA, LDA(簡潔通俗版)

  講到主題模型,大家普遍覺得是LDA,但是其實前面還有一個模型pLSA,即概率隱語義分析。 我們知道,當我們要寫作的時候,是怎麼樣寫成一篇文章的?我們肯定要先確定我們要寫作的主題,然後我們寫的詞,則都是和這個主題相關的(可以看成是從主題中以一定的概率挑選詞出來)。 1.pLSA 【這裏規定一下符號:w是詞,K是主題數量,k是某個主題,d是某篇文檔,M是文檔總數,對某篇文檔,N是這個文檔的詞數。以
相關文章
相關標籤/搜索