爬蟲初步:入門與介紹

1.什麼是爬蟲 經常訪問網絡的朋友可能需要打開各種各樣的網頁。網頁與網頁、網頁內部之間的相互連接都是通過一種叫做超鏈接的東西進行關聯的,這種超鏈接,專業術語叫做統一資源定位符,英文縮寫爲url,也就是我們常說的網址。 用戶通過在瀏覽器中輸入url向服務器訪問請求,使用的是一種叫做http或者https協議的固定通信格式來獲取或者發送數據。 我們可以把互聯網想象爲一個巨大的蜘蛛網絡,如下圖所示: 可
相關文章
相關標籤/搜索