Python爬蟲多線程爬搜索引擎

時間 2019-12-06

原文原文鏈接

爬搜索引擎的信息要注意page和key的變化，還有正則表達式必定要正確html 爬下面的URL： http://weixin.sogou.com/weixin?type=2&query=python 後面再跟page信息正則表達式一共三個線程，第一個負責把URL存到隊列中去，第二個URL負責讀取須要的信息並儲存，第三個若是隊列爲空，則結束微信 import queue import thr

>>阅读原文<<