Text mining and analytics第三週學習筆記

指導性問題: (1)什麼是混合模型?一般來說,如何計算從混合模型中觀察特定單詞的概率?這個概率表達式的一般形式是什麼? (2)混合模型的分量詞分佈的最大似然估計是什麼樣的?他們在什麼意義上「協作」和/或「競爭」?爲什麼我們可以使用固定的背景詞分佈來強制發現的主題詞分佈,以減少它在常見的(通常是非內容的)詞上的概率? (3)EM算法的基本思想是什麼? E步驟通常會做什麼? M-step通常會做什麼?
相關文章
相關標籤/搜索