《信息檢索導論》第五章總結

一、索引壓縮概述 使用壓縮的目的: (1)因爲我們想要把儘量多的數據放入內存,因此壓縮能夠達到這個目的; (2)從磁盤到內存的傳輸時間會縮短; 壓縮分類: (1)無損壓縮:壓縮後的數據能還原全部信息; (2)有損壓縮:壓縮後會丟失一些信息; 如果有損壓縮後丟失的信息用戶並不關心,則有損壓縮也是可以接受的; 二、Heaps定律 通過整個文檔集詞條數來估計詞項數目; 主要思想:隨着文檔集增加,詞項數目
相關文章
相關標籤/搜索