全文檢索基本原理

什麼是全文檢索? 我們生活中的數據總體分爲兩種:結構化數據和非結構化數據。 * 結構化數據:指具有固定格式或有限長度的數據,如數據庫,元數據等。 * 非結構化數據:指不定長或無固定格式的數據,如郵件,word文檔等。   當然有的地方還會提到第三種,半結構化數據,如XML,HTML等,當根據需要可按結構化數據來處理,也可抽取出純文本按非結構化數據來處理。 非結構化數據又一種叫法叫全文數據。 按照數
相關文章
相關標籤/搜索