空間向量搜索引擎技術原理

概述:      空間向量搜索引擎比較兩篇文檔的相似度是利用矩陣代數中非常簡單的技術詞頻來做比較的。     空間向量搜索引擎最重要的組成部分就是理解項空間(term space)的概念,簡單的來說,項空間由整理好的一篇文檔中所出現的關鍵字所組成的。     空間向量搜索引擎還有一個比較重要的組成部分就是項數,項數就是簡單的記錄一篇文檔中所出現關鍵字的次數,它們經常和一些圖、表一起使用。    
相關文章
相關標籤/搜索