urllib實戰4--新聞爬蟲(020)

一:需求與思路       需求:將新浪新聞的首頁的所有新聞爬取到本地   http://news.sina.com.cn/       思路:首先爬首頁,通過正則表達式獲取所有的新聞鏈接,然後依次爬取新聞,並存儲到本地。 二:實戰       運行程序 查看爬取結果: 三:綜上代碼: from urllib import request import re data=request.urlope
相關文章
相關標籤/搜索