搜索引擎的初步認知

搜索引擎(search engine)是指根據一定的策略、運用特定的計算機程序蒐集互聯網上的信息,在對信息進行組織和處理後,爲用戶提供檢索服務的系統。   搜索的三部曲:1,蒐集數據 2,處理數據 3,查詢數據 Crawler seeds 像所有的爬蟲進程一樣,需要一個存放在文本中的種子(seed)列表。它的其他參數有: 發出鏈接—— 用於從一個種子的抓取結果指定需進一步抓取的鏈接。 深度—— 爲
相關文章
相關標籤/搜索