lucene索引文件格式解析

文件名稱 文件後綴名 解析 說明
Segments File

segments.gen編碼

segments_Nspa

存儲段文件的提交點信息  
Lock File write.lock 文件鎖,保證任什麼時候刻只有一個線程能夠寫入索引  
Segment Info .si 存儲每一個段文件的元數據信息  
Compound File .cfs, .cfe 複合索引的文件,在系統上虛擬的一個文件,用於頻繁的文件句柄  
Fields .fnm 存儲域文件的信息  
Field Index .fdx 存儲域數據的指針  
Field Data .fdt 存儲全部文檔的字段信息  
Term Dictionary .tim term字典,存儲term信息  
Term Index .tip term字典的索引文件  
Frequencies .frq 詞頻文件,包含文檔列表以及每個term和其詞頻  
Positions .prx 位置信息,存儲每一個term,在索引中的準確位置  
Norms .nrm.cfs, .nrm.cfe 存儲文檔和域的編碼長度以及加權因子  
Per-Document Values .dv.cfs, .dv.cfe 編碼除外的額外的打分因素  
Term Vector Index .tvx term向量索引,存儲term在文檔中的偏移距離  
Term Vector Documents .tvd 包含每一個文檔向量的信息  
Term Vector Fields .tvf 存儲filed級別的向量信息  
Deleted Documents .del 存儲索引刪除文件的信息
相關文章
相關標籤/搜索