信息檢索——索引壓縮

索引壓縮 目錄 索引壓縮 爲什麼需要壓縮? 兩種壓縮方式: 信息檢索中詞項的統計特性 Heaps定律 Zipf定律 詞典壓縮 用定長數組來存儲詞典中的詞項。 將詞典看成單一字符串的壓縮方法   按塊存儲 前端編碼 倒排記錄表的壓縮 可變字節編碼VB編碼 gamma 編碼   索引壓縮:對詞典和倒排記錄表這兩個數據結構進行壓縮。   爲什麼需要壓縮? 使用更少的磁盤空間 節省資金 在內存中存放更多信
相關文章
相關標籤/搜索