文本挖掘技術——引言

一、概念 文本挖掘是從大量文本數據中抽取隱含的,未知的,可能有用的信息。 難點 語言難點:文本不是給計算機閱讀的、複雜的語言結構(語法、語義、語用)、歧義(更困難的)、多語言 KDD算法難點:海量(大規模的數據集)、高維時效性(隨時間變化的數據和知識)、噪音數據、挖掘出的模式的可理解性 二、模型結構
相關文章
相關標籤/搜索