LDA(Latent Dirichlet Allocation)簡介

一、簡介     LDA(隱狄利克雷分佈)是一種無監督學習的主題概率生成模型,輸入是文檔集合和主題個數,輸出是以概率分佈的形式呈現的主題,常用於主題建模、文本分類、觀點挖掘等多個領域。     它假定了一個前提:文檔相當於一個詞袋(bag-of-words),袋子中的詞是獨立可交換的,沒有語法結構和順序。     其基本思想是:每個文檔(Document)由多個主題(Topic)構成,每個主題都有
相關文章
相關標籤/搜索