全文檢索學習筆記

什麼是全文檢索 1.1 數據分類 我們生活中的數據總體分爲兩種:結構化數據和非結構化數據。 * 結構化數據:指具有固定格式或有限長度的數據,如數據庫,元數據等。 * 非結構化數據:指不定長或無固定格式的數據,如郵件,word文檔等。   當然有的地方還會提到第三種,半結構化數據,如XML,HTML等,當根據需要可按結構化數據來處理,也可抽取出純文本按非結構化數據來處理。 1.2 數據搜索方式 對結
相關文章
相關標籤/搜索