text mining week3

一、概率主題模型:混合的一元語言模型 混合模型中單詞的概率是生成單詞的不同方法的總和。 二、概率主題模型:混合模型估計 假設文本數據包括兩種詞,一種是像the is 等的背景詞,一種是像text mining等的高頻詞分佈中的詞。 爲了篩選高頻率的背景詞,我們設該混合模型爲假,即我們將假設模型中除了以參數theta d表示的文本分佈,所有其他分佈的參數值都是已知的,然後再假設背景詞模型已知。第一個
相關文章
相關標籤/搜索