全文檢索和倒排索引原理講解

正排索引 正排表是以文檔的ID爲關鍵字,表中記錄文檔中每個字的位置信息,查找時掃描表中每個文檔中字的信息直到找出所有包含查詢關鍵字的文檔。 正排表結構如圖1所示,這種組織方法在建立索引的時候結構比較簡單,建立比較方便且易於維護;因爲索引是基於文檔建立的,若是有新的文檔加入,直接爲該文檔建立一個新的索引塊,掛接在原來索引文件的後面。若是有文檔刪除,則直接找到該文檔號文檔對應的索引信息,將其直接刪除。
相關文章
相關標籤/搜索