中文NLP-經常使用的特徵選取方法

爲何要作特徵選取? 構建詞向量是爲了表徵一篇/段文本,方便對文本的分析、分類等操做。對於一個文本,詞向量是一維向量,每一個單元表徵一個特徵詞。怎麼獲取這些特徵詞,簡單粗暴的方法就是,對文本集(全部文本)進行分詞操做,以後將不重複的詞彙構成特徵詞集合,從而構建詞向量。 舉例進行說明:web 「推進長江經濟帶發展是黨中央做出的重大決策,是關係國家發展全局的重大戰略,對實現「兩個一百年」奮鬥目標、實現中
相關文章
相關標籤/搜索