Python爬蟲(1):基本原理

什麼是爬蟲? 爬蟲即網絡爬蟲,英文是Web Spider。翻譯過來就是網絡上爬行的蜘蛛,如果把互聯網看作一張大網,那麼爬蟲就是在大網上爬來爬去的蜘蛛,碰到想要的食物,就把他抓取出來。 我們在瀏覽器中輸入一個網址,敲擊回車,看到網站的頁面信息。這就是瀏覽器請求了網站的服務器,獲取到網絡資源。那麼,爬蟲也相當於模擬瀏覽器發送請求,獲得到HTML代碼。HTML代碼裏通常包含了標籤和文字信息,我們就從中提
相關文章
相關標籤/搜索