《機器學習:算法原理和編程實踐》2:中文文本分類

1、文本挖掘與文本分類的概念      簡言之,文本挖掘就是從非結構化的文本中尋找知識的過程。其7個主要領域如下: 搜索和信息檢索(IR):存儲和文本文檔的檢索,包括搜索引擎和關鍵字搜索。 文本聚類:使用聚類方法,對詞彙、片段、段落或文件進行分組和歸類。 文本分類:對片段、段落或文件進行分組和歸類,在使用數據挖掘分類方法的基礎上,經過訓練地標記示例模型。 Web挖掘:在互聯網上進行數據和文本挖掘,
相關文章
相關標籤/搜索