python爬蟲（一）：爬蟲基本流程

時間 2021-01-09

原文原文鏈接

一、瞭解爬蟲網絡爬蟲（網頁蜘蛛、網絡機器人等）是通過程序去獲取web頁面上的目標數據（圖片、視頻、文本等等）二、爬蟲的本質模擬瀏覽器打開網頁，獲取瀏覽器的數據（爬蟲者想要的數據）；瀏覽器打開網頁的過程：當你在通過瀏覽器訪問一個鏈接後，經過DNS服務器找到服務器IP，向服務器發送一個request；服務器經過解析後，給出一個response（可以是html、js、css等文件內容），瀏覽器（

>>阅读原文<<