信息檢索技術——向量空間模型

上次介紹了信息檢索技術——布爾檢索,布爾模型已經能夠解決一個很重要的問題,就是找到和用戶需求相關的文檔(其中還須要不少處理,好比分詞,歸一化,去掉停用詞等等,咱們只是介紹主要的框架流程)。可是這樣找到的文檔會有不少,也許上千個,也許上萬個,這遠遠不是用戶所要的。用戶也不會去從幾萬個文檔中挑選本身要找的。所以咱們須要對結果進行排序,把最能知足用戶需求的文檔放在最上面顯示給用戶,就像google和ba
相關文章
相關標籤/搜索