文本挖掘學習筆記(一)—布爾檢索

      最近在學習文本挖掘,故而把書中關鍵的內容做個筆記,方便以後查閱。       信息檢索是從大規模非結構化數據(通常是文本)的集合(通常保存在計算機上)中找出滿足用戶需求的資料的(通常是文檔)的過程。按照所處理的數據的規模,信息檢索可以分爲三個級別:         第一個級別是以web搜索爲代表的大規模級別;         第二個級別是小規模,可以看成是與第一種規模相對的另一極端情況
相關文章
相關標籤/搜索