特徵選擇方法之指望交叉熵

本文轉自:http://blog.csdn.net/fighting_one_piece/article/details/38562183 算法 指望交叉熵也稱爲KL距離,反映的是文本類別的機率分佈和在出現了某個特徵的條件下文本類別的機率分佈之間的距離,具體公式表示以下數據結構 其中, P(t)表示特徵t在文本中出現的機率, P(ci)表示ci類文本在文本集中出現的機率, P(ci|t)表示文本包
相關文章
相關標籤/搜索