零基礎如何做Python爬蟲

首先我們來了解爬蟲的基本原理及過程 大部分爬蟲都是按「發送請求——獲得頁面——解析頁面——抽取並儲存內容」這樣的流程來進行,這其實也是模擬了我們使用瀏覽器獲取網頁信息的過程。 簡單來說,我們向服務器發送請求後,會得到返回的頁面,通過解析頁面之後,我們可以抽取我們想要的那部分信息,並存儲在指定的文檔或數據庫中。 在這部分你可以簡單瞭解 HTTP 協議及網頁基礎知識,比如 POSTGET、HTML、C
相關文章
相關標籤/搜索