文本分析概述(數據挖掘)

文本分析概述 非結構化的數據通過向量空間模型轉化爲結構化的數據,並以表格的形式呈現,兩種方式:分詞算法與詞頻統計。 結構化數據:計算機能夠識別處理的數據; 非結構化數據:視頻、圖形、圖像、文本、語音等。 對錶格中的詞,進行特徵選擇,目的是降維,對文本進行向量淨化處理之後,形成最具代表性的文本特徵。 文本分析重要的研究內容 1、文本表示模型的選擇 2、特徵詞選擇算法 文本表示模型相關的方法和技術 1
相關文章
相關標籤/搜索