Lucene源碼(二):文本類似度TF-IDF原理

Lucene中TF-IDF的計算公式與普通的TF-IDF不同。學習以後,感受Lucene的計算方法更加合理,考慮得更加周全。 q:query,即搜索內容,例如:githubgit d:document,即文檔內容,例如:i like github程序員 即咱們的搜索內容"github"跟文檔內容"i like github"的TF-IDF值(類似度)。TF-IDF值越高,搜索的內容與文檔的匹配度越
相關文章
相關標籤/搜索