Python爬蟲基礎:爬取妹子圖片並保存到本地

做爲 Python 爬蟲的入門教程,我想有必要來個爬蟲程序壓壓驚,爬取性感美女的圖片,而後保存到本身的電腦裏面。爽歪歪~html

先看下效果吧,這是我把爬取的圖片自動存儲到的文件夾裏邊:python

圖片已隱藏

爬蟲三步驟:抓取分析存儲正則表達式

抓取

首先咱們要有個目標對吧,咱們想要抓取美女照片,就去找找看哪裏的網站妹紙多,那我們就從哪裏下手唄。cookie

我發現這網站 http://www.meizitu.com 的妹紙圖不錯啊,那還等什麼,抓取唄。python爬蟲

在 python 中有個叫作 requests 模塊,直接 pip install 就能夠了,而後訪問這個網址獲取相應的源碼:學習

response = requests.get(url)
return response

好比我想獲取性感美女的源碼,那麼個人 url 就是 http://www.meizitu.com/a/sexy... 經過get請求咱們就能夠獲取返回的響應體了,咱們經過response.text就能夠或源碼。部分源碼截圖以下:網站

分析

抓取完了以後,咱們對咱們感興趣的內容要進行分析了,這時候就涉及到「正則表達式」,根據咱們定義的一些規則,來獲取咱們想要的內容。url

咱們如今固然是對返回源碼中的美女圖片感興趣啦,從返回的源碼中就能夠看到,美女的圖片都是包裹在 img 標籤中的:spa

那麼咱們就能夠用 re 模塊來匹配獲取咱們想要的圖片連接了:code

p = r'<img src="([^"]+\.jpg)"'

img_addrs = re.findall(p, html)

獲取到的部分圖片連接截圖:

存儲

既然獲取到圖片連接了,那麼接下來就能夠存儲了,這裏暫時存儲到本身本地電腦上吧:

with open(filename,'wb') as f:
    img = url_open(each).content
    f.write(img)

ok,這樣就完成了,是否是很簡單?固然爬蟲說簡單也簡單,說複雜也複雜,關鍵是要看本身想作什麼事情,若是你從這個例子中發現本身對 python 又多了些許興趣,那不妨多關注我,我日後給你寫一些 python爬蟲 所須要的知識點,例如其它的爬蟲模塊如Scrapy ,一些表單的請求參數,反爬蟲,cookie,多進程抓取等等。

專門爲 Python 開了個公衆號:學習python的正確姿式 ,在裏面發送 「meizi」獲取抓美女的源代碼吧。

不說了,我再去抓取多一點美女的圖片了。

相關文章

相關文章
相關標籤/搜索