Python學習之淺談爬蟲(1)

初識爬蟲        網絡爬蟲,即Web Spider,是一個很形象的名字。把互聯網比喻成一個蜘蛛網,那麼Spider就是在網上爬來爬去的蜘蛛。網絡蜘蛛是通過網頁的鏈接地址來尋找網頁的。通過它可以獲取網頁數據的腳本,簡單地說是請求網頁,提取網頁源代碼。        如果把整個互聯網當成一個網站,那麼網絡蜘蛛就可以用這個原理把互聯網上所有的網頁都抓取下來。這樣看來,網絡爬蟲就是一個爬行程序,一個
相關文章
相關標籤/搜索