Python爬蟲多線程爬搜索引擎

爬搜索引擎的信息要注意page和key的變化,還有正則表達式必定要正確html 爬下面的URL:    http://weixin.sogou.com/weixin?type=2&query=python 後面再跟page信息正則表達式 一共三個線程,第一個負責把URL存到隊列中去,第二個URL負責讀取須要的信息並儲存,第三個若是隊列爲空,則結束微信 import queue import thr
相關文章
相關標籤/搜索