【Web crawler】爬蟲之百度首頁

剛開始學習爬蟲,照着教程手打了一遍,仍是蠻有成就感的。使用版本:python2.7python

*注意:python2的默認編碼是ASCII編碼而python3默認編碼是utf-8python2.7

import urllib2

url = "http://www.baidu.com"
response = urllib2.urlopen(url)
print response.read().decode('utf-8')

不過建議你們不要像上面那樣寫,這樣寫最好:學習

#定義須要用到的庫urllib2
 import urllib2

#定義URL,構建請求
url = "http://www.baidu.com"
request = urllib2.Request(url)

#返回
 response = urllib2.urlopen(request)

#打印返回的數據
 print response.read().decode('utf-8')

相關文章
相關標籤/搜索