爬蟲 1 大致流程

一般來說,爬蟲大致分爲幾個流程: 1. 準備工作 2. 獲取數據 3. 解析內容 4. 保存數據 爬蟲的本質,其實就是讓腳本程序模擬認爲操作,通過瀏覽器去訪問網頁(網站),對於網站服務器來說,人爲的通過瀏覽器訪問和通過腳本程序爬蟲沒有太大區別(反爬蟲這些我還沒學,所以這裏可能說的有點籠統,這裏只是說說我目前的理解)。不過不同的是,人爲訪問網頁,獲取的是一個網頁(人眼看到的頁面);而腳本獲取的信息,
相關文章
相關標籤/搜索