索引壓縮學習總結

詞典壓縮 詞典中通常包含三部分信息,原詞,df,及倒排索引指針.其中要壓縮的是原詞,存在不規則性 若是都去開闢最大那個原詞的字節空間,那麼整個字典樹將有很是大的空間浪費. 將單詞單獨抽取出來放在一個單獨的存儲區內,原詞的位置存放指向該詞語的指針. 再次優化能夠將指針在某個範圍內僅僅保存一個指針,在單詞存儲區保存原詞及詞長. 倒排列表壓縮算法 評價索引壓縮算法的指標:壓縮率,壓縮速度,解壓速度,先對
相關文章
相關標籤/搜索