文本挖掘淺述

文本挖掘是一個融合了多學科的交叉領域,對文本挖掘的研究需要將自然語言處理、數據挖掘、信息檢索、機器學習等衆多領域的知識相結合。文本挖掘是對大量文本信息源的內容進行預處理、特徵提取等,轉化爲數據集合後,再進行結構分析、文本摘要、文本分類、文本聚類、關聯分析等,最後將可視化的結果反饋給用戶,供用戶瀏覽、查詢。文本挖掘的一般處理過程如下圖所示。(簡言之:文本挖掘就是從大量的文本信息中提煉出高效的信息,並
相關文章
相關標籤/搜索