PLSA的理解及推導

        plsa對於文本主題的發展,在於其對於lsa進行了概率化,也就是文檔的生成過程涉及到了選擇主題,然後從主題中選擇單詞的過程,這二個選擇的過程都滿足多項式分佈的情況。        對於PLSA而言,就是一個典型的EM算法問題呀。主題就是隱含變量,已知變量就是單詞,文本的情況。再求解EM算法時,首先要明確極大化的對數似然函數,然後求E步,E步求解中首先要把隱含變量的條件概率求出來,然
相關文章
相關標籤/搜索