爬取糗事百科

任務:爬取糗事百科發佈者和發佈內容 實現: 糗事百科的段子還是很不錯的,剛開始爬蟲的同學們可以拿它練練手哦。 下面上代碼啦,請求頭headers是很重要噠,還要注意編碼問題呦,這個編碼問題可以抽出時間 來專門研究他喲。 還有這次的正則有點不太好寫,正則很有用的,要學會呦。 # -*- coding:utf-8 -*- import urllib2 import re import sys relo
相關文章
相關標籤/搜索