python爬蟲(一):爬蟲基本流程

一、瞭解爬蟲 網絡爬蟲(網頁蜘蛛、網絡機器人等)是通過程序去獲取web頁面上的目標數據(圖片、視頻、文本等等) 二、爬蟲的本質 模擬瀏覽器打開網頁,獲取瀏覽器的數據(爬蟲者想要的數據); 瀏覽器打開網頁的過程:當你在通過瀏覽器訪問一個鏈接後,經過DNS服務器找到服務器IP,向服務器發送一個request;服務器經過解析後,給出一個response(可以是html、js、css等文件內容),瀏覽器(
相關文章
相關標籤/搜索