機器學習-文本特徵選擇

1、課題背景概述web 文本挖掘是一門交叉性學科,涉及數據挖掘、機器學習、模式識別、人工智能、統計學、計算機語言學、計算機網絡技術、信息學等多個領域。文本挖掘就是從大量的文檔中發現隱含知識和模式的一種方法和工具,它從數據挖掘發展而來,但與傳統的數據挖掘又有許多不一樣。文本挖掘的對象是海量、異構、分佈的文檔(web);文檔內容是人類所使用的天然語言,缺少計算機可理解的語義。傳統數據挖掘所處理的數據是
相關文章
相關標籤/搜索