主成分分析

        問題:假設在IR中咱們創建的文檔-詞項矩陣中,有兩個詞項爲「learn」和「study」,在傳統的向量空間模型中,認爲二者獨立。然而從語義的角度來說,二者是類似的,並且二者出現頻率也相似,是否是能夠合成爲一個特徵呢?session        《模型選擇和規則化》談到的特徵選擇的問題,就是要剔除的特徵主要是和類標籤無關的特徵。好比「學生的名字」就和他的「成績」無關,使用的是互信息
相關文章
相關標籤/搜索