主題模型的學習

對於主題模型而言,重新再理一遍思路,然後在梳理思路的同時,可以知道自己理解不到位的點,也許可以知道下一步的應用情況。 一般而言,我們對於文檔集的表示是通過在詞項空間來表示的,即利用詞袋模型(bag-of-words)的形式來表示文檔,此時的詞項空間維數很大,通過主題模型之後,可以將文檔的維數降低到K維,(K個主題),此時就可以大幅度的降維。 主題模型的起源是LSA(LSI),其並不是一個概率模型,
相關文章
相關標籤/搜索