爬蟲(抓取靜態頁面和動態頁面的區別,get請求和post請求的區別)

靜態頁面: 非結構化數據:HTMLcss 處理方式:正則表達式,xpath, beautifulsoup4html 靜態頁面中的數據都包含在網頁的HTML中(通常都是get請求)前端 因此能夠直接在網頁的HTML中提取數據node 關鍵詞通常都以查詢字符串的方式拼接在URL中python 分析URL的變化能夠進行多頁爬取ajax python2:  urllib + urllib2    /   
相關文章
相關標籤/搜索