sphinx源碼分析總結

http://www.cnblogs.com/bonelee/p/6667955.html shinx索引部分源碼分析——過程:鏈接到CSphSource對應的sql數據源,經過fetch row取其中一行,而後解析出field,分詞,得到wordhit,最後再加入到CSphSource的Hits裏
http://www.cnblogs.com/bonelee/p/6668015.html sphinx索引部分源碼續——過程:鏈接到CSphSource對應的sql數據源,經過fetch row取其中一行,而後解析出field,分詞,得到wordhit,最後再加入到CSphSource的Hits裏
http://www.cnblogs.com/bonelee/p/6251091.html sphinx索引分析——文件格式和字典是double array trie 檢索樹,索引存儲 – 多路歸併排序,文檔id壓縮 – Variable Byte Coding
http://www.cnblogs.com/bonelee/p/6249343.html sphinx 源碼閱讀之分詞,壓縮索引,倒排——單詞對應的文檔ID列表本質和lucene無異 也是外部排序再壓縮 解壓的時候須要所有掃描doc_ids列表偏移量相加得到最終的文檔ID
http://www.cnblogs.com/bonelee/p/6249396.html sphinx 源碼閱讀之分詞,壓縮索引,倒排——單詞對應的文檔ID列表本質和lucene無異 也是外部排序再壓縮 解壓的時候須要所有掃描doc_ids列表偏移量相加得到最終的文檔IDhtml

相關文章
相關標籤/搜索