爬蟲（抓取靜態頁面和動態頁面的區別，get請求和post請求的區別）

時間 2020-02-11

原文原文鏈接

靜態頁面：非結構化數據：HTMLcss 處理方式：正則表達式，xpath, beautifulsoup4html 靜態頁面中的數據都包含在網頁的HTML中（通常都是get請求）前端因此能夠直接在網頁的HTML中提取數據node 關鍵詞通常都以查詢字符串的方式拼接在URL中python 分析URL的變化能夠進行多頁爬取ajax python2: urllib + urllib2 /

>>阅读原文<<