網頁下載器:將URL對應的網頁以HTML下載到本地,用於後續分析 常見網頁下載器:Python官方基礎模塊:urllib2 第三方功能包:requests
python 3.x中urllib庫和urilib2庫合併成了urllib庫。 其中urllib2.urlopen()變成了urllib.request.urlopen() urllib2.Request()變成了urllib.request.Request()
python2中的cookielib改成http.cookiejar.
import http.cookiejar
代替 import cookielib
再次強調:print 「hello」;應寫爲print("hello");
python3對urllib和urllib2進行了重構,拆分紅了urllib.request, urllib.response, urllib.parse, urllib.error等幾個子模塊,這樣的架構從邏輯和結構上說更加合理。
urljoin如今對應的函數是urllib.parse.urljoinpython