什麼是python爬蟲?

1、爬蟲 就是給網站發起請求,並從響應中提取數據的自動化程式; 發起請求,獲取響應 通過http庫,對目標點進行請求。等同於自己打開瀏覽器,輸入地址 常用庫:urllib、urllib3、requests 服務器會返回請求的內容,一般是:HTML、二進制文件(視頻、音頻)、文檔、json字符串等 解析內容 尋找自己需要的信息、就是利用正則表達式或者其他工具庫提取目標信息 常用庫:re、beauti
相關文章
相關標籤/搜索