編寫爬蟲時遇到報錯:
「TypeError: cannot use a string pattern on a bytes-like object」
百度了一下,出現緣由是python3中request.urlopen().read()返回的內容類型不是string,而是byte,因此須要在正則匹配時對被匹配對象解碼
將python
links=re.findall('<loc>(.*?)</loc>',sitemap)
改成url
links=re.findall('<loc>(.*?)</loc>',sitemap.decode('utf-8'))