數據挖掘筆記-情感傾向點互信息算法

       點間互信息(PMI)主要用於計算詞語間的語義類似度,基 本思想是統計兩個詞語在文本中同時出現的機率,若是機率越大,其相關性就越緊密,關聯度越高。兩個詞語word1與word2的PMI值計算公式以下式所示爲: P(word1&word2)表示兩個詞語word1與word2共同出現的機率,即word1與word2共同出現的文檔數, P(word1)與P(word2)分別表示兩個詞語單獨出
相關文章
相關標籤/搜索