MR案例之倒排索引TF-IDF

MR案例之倒排索引 簡介: "倒排索引"是文檔檢索系統中最經常使用的數據結構,被普遍地應用於全文搜索引 它主要是用來存儲某個單詞(或詞組)在一個文檔或一組文檔中的存儲位置的映射, 即提供了一種根據內容來查找文檔的方式。 因爲不是根據文檔來肯定文檔所包含的內容, 而是進行相反的操做,於是稱爲倒排索引(Inverted Index)。 詳情描述 一般狀況下,倒排索引由一個單詞(或詞組)以及相關
相關文章
相關標籤/搜索