在瀏覽器檢查元素頁面中,選取Network中的XHR選項便可觀察每次加載頁面,網頁發出的請求,觀察url的規律便可利用封裝的函數對每一頁進行爬取。python
如232頁網頁的地址爲http://jandan.net/pic/page-232#comments,其中page參數就表明了第幾頁,用格式化的方法,把頁數替換掉,就能夠獲得每頁的地址了。瀏覽器
urls=['http://jandan.net/pic/page-{}#comments'.format(i) for i in range(1,100)]#這個列表包含了1-99頁的地址