python0705課程筆記

A. 層級 B. 深度和廣度優先(爬蟲) 深度優先是指網絡爬蟲會從起始頁開始,一個鏈接一個鏈接跟蹤下去,處理完這條線路之後再轉入下一個起始頁,繼續追蹤鏈接,通過下圖進行理解: abdeicfgh      廣度優先,有人也叫寬度優先,是指將新下載網頁發現的鏈接直接插入到待抓取URL隊列的末尾,也就是指網絡爬蟲會先抓取起始頁中的所有網頁,然後在選擇其中的一個連接網頁,繼續抓取在此網頁中鏈接的所有網頁
相關文章
相關標籤/搜索