Text mining and analytics第三週學習筆記

時間 2020-12-23

標籤文本挖掘與分析斯坦福文本挖掘與分析 PLSA LDA 混合模型欄目 HTML 简体版

原文原文鏈接

指導性問題：（1）什麼是混合模型？一般來說，如何計算從混合模型中觀察特定單詞的概率？這個概率表達式的一般形式是什麼？（2）混合模型的分量詞分佈的最大似然估計是什麼樣的？他們在什麼意義上「協作」和/或「競爭」？爲什麼我們可以使用固定的背景詞分佈來強制發現的主題詞分佈，以減少它在常見的（通常是非內容的）詞上的概率？（3）EM算法的基本思想是什麼？ E步驟通常會做什麼？ M-step通常會做什麼？

>>阅读原文<<