在Python3.x中,咱們可使用urlib這個組件抓取網頁,urllib是一個URL處理包,這個包中集合了一些處理URL的模塊,以下:測試
1.urllib.request模塊是用來打開和讀取URLs的;fetch
2.urllib.error模塊包含一些有urllib.request產生的錯誤,可使用try進行捕捉處理;url
3.urllib.parse模塊包含了一些解析URLs的方法;blog
4.urllib.robotparser模塊用來解析robots.txt文本文件.它提供了一個單獨的RobotFileParser類,經過該類提供的can_fetch()方法測試爬蟲是否能夠下載一個頁面。it