中文文本分類1

文本挖掘(Text Mining)是從非結構化文本信息中獲取用戶感興趣或者有用的模式的過程。 文本挖掘是指從大量文本數據中抽取事先未知的、可理解的、最終可用的知識的過程,同時運用這些知識更好地組織信息以便將來參考。 文本預處理 文本處理的核心任務是把非結構化和半結構化的文本轉換爲結構化的形式,即向量空間模型。 具體步驟: 1. 選擇處理的文本範圍 選擇恰當的範圍取決於文本挖掘任務的目標: 對於分類
相關文章
相關標籤/搜索