python2.7爬蟲實戰小項目

爬蟲原理和思想 本項目實現的基本目標:在捧腹網中,把搞笑的圖片都爬下來,注意不需要爬取頭像的圖片,同時,將圖片命好名放在當前的img文件中。 爬蟲原理和思想 爬蟲,就是從網頁中爬取自己所需要的東西,如文字、圖片、視頻等,這樣,我們就需要讀取網頁,然後獲取網頁源代碼,然後從源代碼中用正則表達式進行匹配,最後把匹配成功的信息存入相關文檔中。這就是爬蟲的簡單原理。 思想步驟:  讀取網頁並獲取源代碼,使
相關文章
相關標籤/搜索