Jmeter(三十五)_精確實現網頁爬蟲

時間 2019-11-11

標籤 jmeter 三十五精確實現網頁爬蟲欄目 HTML 简体版

原文原文鏈接

Jmeter實現了一個網站文章的爬蟲，能夠把全部文章分類保存到本地文件中，並以文章標題命名shell

它原理就是對網頁提交一個請求，而後把返回的全部值提取出來，利用ForEach控制器去實現遍歷。下面來介紹一下如何操做。函數

首先咱們須要對網頁提交一個請求。咱們對一個站點發起一個請求，觀察一下返回值能夠發現中間有不少中文title，這些title都是href標籤，他們做爲超連接能夠跳轉到正文測試

咱們用xpath提取器獲取這些href的title，而且用-1提取所有網站

用foreach控制器遍歷提取的title，並傳參url

經過beanshell腳本將遍歷提取的title保存到本地文件，文件保存爲title.csvspa

用matchNr函數獲取返回的title總數，做爲後續csv提取器的循環次數3d

在循環控制器下，用csv提取器從以前保存到本地的title.csv中循環讀取title，並做爲參數傳遞到後續接口的url中blog

循環控制器下，經過csv傳參，循環觸發url接口

循環觸發url以後，用xpath表達式從url中提取出文本，傳遞變量爲textget

循環控制器下，經過foreach控制器遍歷以前的提取的text，保存到本地文件。文件名用遍歷獲取的title依次命名建立

注：難點在於，須要按照超連接的標題建立本地文件，並把超連接以後的文本正確保存到文件之中

你還在爲找不到可練習的接口而煩惱嗎？如今加入龍淵閣，咱們手把手教你搭建屬於本身的接口測試環境！

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。