爬蟲篇-爬取博客園文章的兩個案例,寫入sql server數據庫

1,爬取指定用戶發表的文章前50頁,不足50頁則全部爬取,提取標題,摘要,文章鏈接,提交詳情; 代碼如下: import pymssql import requests from lxml import etree import re import time headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x6
相關文章
相關標籤/搜索