NLP 人與機器的對話

python 處理NLP問題 1.分詞: 中文可用jieba庫直接分詞 英文依靠逗號 2.詞形歸一化(詞幹提取)(單詞變體還原) 在英文中使用,可將動詞一些變化轉化爲原型。 語言形態學和信息檢索裏,詞幹提取是去除詞綴得到詞根的過程,例如working的詞幹爲work。 3.去除stopwords 將助詞等去掉,留下較爲純粹的關鍵詞。 stopwords有對應的成熟的數據庫。 同義詞問題 方法一 通
相關文章
相關標籤/搜索