python爬蟲基礎知識的總結

什麼是爬蟲? 1、爬蟲概述 簡單來講,爬蟲就是獲取網頁並提取和保存信息的自動化程序。 1.獲取頁面(如urllib、requests等) 2.提取信息(Beautiful Soup、pyquery、lxml等) 3.保存數據(MySQL、MongoDB等) 4.自動化程序 2、關於JS渲染的頁面? 1.使用urllib、requests 等庫請求當前頁面時,只是獲得html代碼,它不會幫
相關文章
相關標籤/搜索