關於搜索引擎:蒐集、分析、索引、查詢。

1. 圖的遍歷方法有兩種,深度優先和廣度優先。搜索引擎中的爬蟲是通過廣度優先策略來爬取網頁的。搜索引擎爲什麼選擇廣度優先策略,而不是深度優先策略呢? 搜索引擎要優先爬取權重較高的頁面,離種子網頁越近,較大可能權重更高,廣度優先更合適。 2. 大部分搜索引擎在結果顯示的時候,都支持摘要信息和網頁快照。你知道如何改造嗎? 摘要信息: 增加 summary.bin 和 summary_offset.bi
相關文章
相關標籤/搜索