向量空間搜索引擎理論

簡述 向量空間搜索引擎使用了一個非常簡單的計數對於矩陣代數去比較基於詞頻的文檔。 向量空間搜索引擎的第一個主要組成部分是概念術語空間。簡單地說,術語空間由每個唯一的單詞組成出現在文檔集合中。 向量空間搜索引擎的第二個主要組成部分是項目計數。項目計數只是記錄每個項在an中出現的次數個人文檔。這通常表示爲一個表,如下圖闡述。 通過使用term空間作爲座標空間,和項目計數作爲座標在那個空間中,我們能夠給
相關文章
相關標籤/搜索