網絡數據採集——收集整個網站

from urllib.request import urlopen from bs4 import BeautifulSoup import re pages=set()#避免存入相同的連接 def getlinks(pageUrl): global pages html=urlopen("http://en.wikipedia.org"+pageUrl) bsOb
相關文章
相關標籤/搜索