主題分析模型LDA的spark實現

主體分析模型主要有PLSA(Probabilistic Latent Semantic Anlysis,機率引語義分析)和LDA(Latent Dirichlet Allocation,隱含狄利克雷分佈),在此暫時介紹LDA的spark實現。sql     * 主題分析模型自動分析每一個文檔,統計文檔內的詞語,根據統計的信息來判斷當前文檔含有     * 哪些主題,以及每一個主題所佔的比例格式多少
相關文章
相關標籤/搜索