文本挖掘之詳細總體的流程

一、分詞算法 二、特徵權重的計算網絡 三、模型的選擇ide (1)向量空間模型與布爾模型 spa (2)機率模型blog 四、特徵選擇文檔 IG(特徵選擇),DF(文檔頻率),IF-IDF,ECE(指望交叉熵),X方,MI(文檔互信息),WET(文檔證據權重),OI,CC(相關係數)等經常使用的特徵選擇神經網絡 在我前面的文章都有提到im 五、特徵抽取d3 LDA(線性特徵抽取),PCA(主成分分
相關文章
相關標籤/搜索