SparkMllib主題模型案例講解

一  本文涉及到的算法java 1, LDA主題模型正則表達式 符號定義算法 文檔集合D,m篇,topic集合T,k個主題apache D中每一個文檔d看做一個單詞序列< w1,w2,...,wn >,wi表示第i個單詞,設d有n個單詞。(LDA裏面稱之爲word bag,實際上每一個單詞的出現位置對LDA算法無影響)安全 D中涉及的全部不一樣單詞組成一個大集合VOCABULARY(簡稱VOC)運
相關文章
相關標籤/搜索