Jmeter(四十一)_圖片爬蟲

時間 2019-11-07

標籤 jmeter 四十一圖片爬蟲欄目網絡爬蟲简体版

原文原文鏈接

今天教你們用元件組合，作一個網頁圖片爬蟲。html

須要用到的元件：循環控制器+計數器+xpath提早器+函數嵌套+beanshell代碼shell

首先咱們肯定一下要爬取的圖片網站：https://dp.pconline.com.cn/list/all_t5.html微信

經過F12觀察一下他的html代碼，發現這些圖片都是經過href連接跳轉以後，訪問的src圖片函數

那麼咱們能夠考慮先對網站發起請求，經過xpath表達式提取到圖片的src，也就是圖片的訪問連接性能

而後再經過xpath提取出這些圖片的標題學習

由於考慮到每一組圖片和標題都是一一對應的，所以這裏提取出來的匹配數字也能夠認爲是一一對應。測試

在dubug中咱們能夠看到，url和標題都提取了50個，且一一對應。網站

下面咱們添加一個循環控制器，循環次數就是debug中的matchNr

在循環控制器中添加一個計數器，用來計算須要執行爬取的次數url

添加一個http請求，在循環控制器下，循環對debug中獲取到的url發起請求，同時遍歷寫入圖片標題spa

每一次發起請求以後，都把請求獲取的圖片經過代碼寫入本地，同時遍歷寫入圖片名稱

執行腳本觀察響應結果，觀察本地文件寫入結果

友情提示：這一套爬蟲腳本，摒棄了以往經過foreach控制器遍歷進行爬蟲的方法。轉而經過函數嵌套的方式，同步遍歷多個參數進行文件寫入。難點就在於函數嵌套遍歷的理解和xpath元素定位，但願你們好好研究，有問題能夠和我進行探討！

能夠添加微信：14751700162
或者聯繫QQ：1144890271

只須要分享博客任意兩篇文章，截圖經過以上任意方式聯繫，便可獲取最新編寫的《jmeter接口自動化與性能測試實戰試讀版》

掃描二維碼關注咱們的公衆號，隨時獲取最新文章

咱們專一於jmeter的接口自動化和性能專題研究，若是您在學習過程當中遇到了難題，請及時聯繫咱們，將給您一個滿意的答案！

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。