爬蟲學習(一)

爬蟲概念 是一種按照必定的規則,自動地抓取萬維網信息的程序或者腳本,簡單來講就是一個網絡機器人,是一個程序python 爬蟲執行流程 1.提交url給網站服務器,服務器會響應一個信息給客戶端 2.解析網頁(提取咱們須要的有用信息) 3.保存信息,保存到文本文檔,mysql數據庫,EXCELmysql 爬蟲分類 1.通用網絡爬蟲: 由種子url擴展到整個web 策略:深度優先,廣度優先 2.聚焦網絡
相關文章
相關標籤/搜索