文本分類(1)-文本預處理

在進行文本分類以前,須要對文本進行預處理。中文文本和英文文本預處理的方式有所差異。 (1)英文文本預處理 文本預處理過程大體分爲如下幾點: 一、英文縮寫替換 預處理過程當中須要把英文縮寫進行替換,如it’s和it is是等價的,won’t和will not也是等價的,等等。git text = "The story loses its bite in a last-minute happy end
相關文章
相關標籤/搜索