互聯網搜索引擎

說明:文章內容來源於課程視頻和課程ppt。我只學習了課程沒有做習題。文章不是翻譯,是我對課程的理解。 1 挑戰  互聯網搜索引擎與一般搜索引擎的區別主要在以下問題。  第一是數據量(scalability)。互聯網搜索需要處理的數據量大,如何保證能有效地處理這些數據,保證搜索的完整性,同時搜索速度也要在可接受範圍內。解決策略:索引時候並行處理,搜索時候分佈式處理。  第二個是如何衡量數據質量,過濾
相關文章
相關標籤/搜索