LDA的演變1--從算法層面來介紹LDA的由來或者說發展

主要是從算法層面來介紹LDA的由來或者說發展   文本挖掘的研究對象是文本,比如對文本進行分類或者情感分析等。由於文本是一種非結構化的數據,這樣就不利於計算機的處理,所以研究者們開始對文本進行數字化處理。   最開始比較簡單的方法是tf-idf方法。tf-idf機制可以將任意長度的文檔轉化爲固定長度的向量(固定長度爲詞典中的詞彙數),可以簡明易懂地將每個文檔表示出來。雖然tf-idf方法可已經較好
相關文章
相關標籤/搜索