全文檢索的基本原理

我們生活中的數據總體分爲兩種: 結構化數據和非結構化數據。 結構化數據: 指具有固定格式或有限長度的數據,如數據庫,元數據等。 非結構化數據: 指不定長或無固定格式的數據,如郵件, word 文檔等。 當然有的地方還會提到第三種,半結構化數據,如 XML, HTML 等,當根據需要可按結構化 數據來處理,也可抽取出純文本按非結構化數據來處理。非結構化數據又一種叫法叫全文數據。 按照數據的分類,搜索
相關文章
相關標籤/搜索