文本挖掘與分析課程筆記_Week3

第三週筆記 概率主題模型:混合一元語言模型 用兩個詞分佈來表示,以此去除背景詞(常見但意義不大的詞) θd表示主題詞分佈 θB表示背景詞分佈 文本中某個詞的概率計算 混合兩個一元語言模型(解析) 利用最大似然求解混合兩個一元語言模型時,θd和θB會出現「合作」和「競爭」 在θB(背景詞)分佈中,概率大的詞,相對地在θd(主題詞)中概率會變小 某個詞出現的次數越多,那麼它在θd中的概率越高 假設【所
相關文章
相關標籤/搜索