【Web crawler】爬蟲之百度首頁

時間 2019-11-17

原文原文鏈接

剛開始學習爬蟲，照着教程手打了一遍，仍是蠻有成就感的。使用版本：python2.7python

*注意：python2的默認編碼是ASCII編碼而python3默認編碼是utf-8python2.7

import urllib2

url = "http://www.baidu.com"
response = urllib2.urlopen(url)
print response.read().decode('utf-8')

不過建議你們不要像上面那樣寫，這樣寫最好：學習

#定義須要用到的庫urllib2
 import urllib2

#定義URL，構建請求
url = "http://www.baidu.com"
request = urllib2.Request(url)

#返回
 response = urllib2.urlopen(request)

#打印返回的數據
 print response.read().decode('utf-8')

1. Java爬蟲百度首頁
2. Web-Crawler（爬蟲基礎）
3. web前端之百度首頁仿寫
4. 百度文庫爬蟲之ppt爬蟲
5. 爬蟲:php實現百度首頁書籤的獲取,以及百度首頁書籤的遷移
6. python爬蟲之爬取百度音樂
7. php爬蟲框架crawler
8. java簡易爬蟲Crawler
9. python簡單爬蟲爬取百度百科python詞條網頁
10. python爬蟲之百度貼吧
更多相關文章...
• Web 網頁驗證 - 網站建設指南
• ASP.NET Web Pages - 全局頁面 - ASP.NET 教程
• 算法總結-廣度優先算法
• 算法總結-深度優先算法

相關標籤/搜索