公式

1. 計算詞境相似度 假如d1表示cat,d2表示dog,x1,x2,…,xn分別表示句子中單詞正則化後出現的概率。 2. TF-IDF加權 TF: 詞頻 IDF:反文檔頻率 包含詞條的文檔越少,IDF越大,則說明詞條具有很好的類別區分能力。 TF-IDF的計算: TF*IDF 3. 熵函數 條件熵函數 eg. 4. 互信息 互信息的計算:KL發散 5. 極大似然估計 對事件發生的次數歸一化 當c
相關文章
相關標籤/搜索