大數據該挖掘,主要挖掘什麼,什麼是文本挖掘?

什麼是文本挖掘 文本挖掘是一門交叉性學科,涉及數據挖掘、機器學習、模式識別、人工智能、統計學、計算機語言學、計算機網絡技術、信息學等多個領域。文本挖掘就是從大量的文檔中發現隱含知識和模式的一種方法和工具,它從數據挖掘發展而來,但與傳統的數據挖掘又有許多不同。文本挖掘的對象是海量、異構、分佈的文檔(web);文檔內容是人類所使用的自然語言,缺乏計算機可理解的語義。 傳統數據挖掘所處理的數據是結構化的
相關文章
相關標籤/搜索