新浪明星日誌推薦系統——爬蟲爬取數據(2)

由於之前的改造,現在將爬蟲的功能做了一些改變,具體實現的功能是將推薦的日誌全部抓取下來,並存放在以文章標題命名的文件中,代碼如下: import urllib import os,re import sys from bs4 import BeautifulSoup reload(sys) sys.setdefaultencoding("utf-8") def if_str(str_t): if
相關文章
相關標籤/搜索