LDA模型困惑度計算出現的問題

LDA程序使用的是JGibbLDA 讀theta文件,構造theta二維矩陣。 讀phi文件,構造phi二維矩陣。 讀tassign文件,獲得每篇文本的詞數Nd,繼而獲得測試集的總詞數Nsum;並根據tassign文件構造每篇文本全部詞組成的詞表。 編程實現,根據tassign文件構造測試集每篇文本中全部詞組成的詞表,根據該詞表(Map形式,存儲的是每篇文本全部出現的詞的詞id(詞不排重)),獲得
相關文章
相關標籤/搜索