信息檢索導論學習筆記(6)-文檔評分,詞項權重計算及向量空間模型

參數化索引及域索引 迄今爲止,咱們都將文檔當作一系列詞項的序列.實際上,大多數文檔都具備額外的結構信息.數字文檔一般會把與之相關的元數據(metadata)以機讀的方式一塊兒編碼.所謂元數據,指的是和文檔相關的一些特定形式的數據,好比文檔的做者,標題以及出版日期等等. 問題:考慮查詢"尋找由William Shakespeare 於 1961年撰寫,其中包含短語alas poor Yorick的文
相關文章
相關標籤/搜索