如何肯定LDA的topic個數

之前一直是按經驗設置topic個數,數據量小就少點,數據量大就多點,大概50-500吧。最近有同窗跟我討論,纔想起來該找找相關文獻,學習一下如何科學的肯定topic個數。機器學習 1.用perplexity-topic number曲線學習 LDA有一個本身的評價標準叫Perplexity(困惑度),能夠理解爲,對於一篇文檔d,咱們的模型對文檔d屬於哪一個topic有多不肯定,這個不肯定程度就是P
相關文章
相關標籤/搜索