其實到這裏我也不知道應該怎麼講,由於一開始我並不知道這個最簡單的爬蟲程序怎麼寫,單靠我本身想是寫不出來的,因此就上網找了個程序,我要先讓程序運行起來而後再慢慢的一行一行代碼的去解析,我以爲這個相對來講是一個比較好的方法
因此這裏先拋給你們這個程序,先試着讓程序跑起來
1. 最簡單的python爬蟲源程序
這是一個最簡單的python爬蟲,它的功能是將網頁的源代碼獲取並顯示出來,代碼很簡單加上註釋纔有8行html
#!/usr/bin/env python # -*- coding: UTF-8 -*- __author__ = '217小月月坑' import urllib2 response = urllib2.urlopen("http://python.jobbole.com/81339/") print response.read()