Python爬蟲(2.網絡爬蟲的實現原理及技術)

網絡爬蟲的實現原理及技術 1.   網絡爬蟲實現原理 以兩種爬蟲爲例,講解網絡爬蟲的實現原理。 1)       通用網絡爬蟲 圖1 通用網絡爬蟲實現原理及過程 見圖1,通用網絡爬蟲的實現原理及過程可以簡要概括爲:          i.           獲取初始URL。初始的URL地址可以由用戶人爲指定,也可以由用戶指定的某個或某幾個初始爬去網頁決定。         ii.        
相關文章
相關標籤/搜索