自然語言處理(三)主題模型

爲了解決「一詞多義」和「多詞一意」的問題,引入「主題」 LDA本質是一個三層貝葉斯網絡 1、共軛分佈 1、Beta分佈是二項分佈的共軛先驗分佈 2、Dirichlet分佈是多項分佈的共軛先驗分佈 Dirichlet分佈的參數 [α1,α2,....,αn] ,一般 α 都取一樣的值。 α=1 均勻分佈 α>1 主題分佈相等的概率增大 α<1 某一主題突出的概率增大 2、LDA模型 LDA模型框圖如
相關文章
相關標籤/搜索