摘要 : XPath Helper能夠支持在網頁點擊元素生成xpath,整個抓取使用了xpath、正則表達式、消息中間件、多線程調度框架的chrome插件。正則表達式
xpath:是一門XML和HTML文檔中查找信息的語言,可用來在XML和HTML 文檔中對元素和屬性進行遍歷chrome
下載地址:https://pan.baidu.com/s/18iF5xI19AC7mvAXA8ZWqMw瀏覽器
1、安裝多線程
下載後打開chrome瀏覽器中的擴展程序,把文件拖入便可安裝框架
2、使用spa
1.打開網頁後,快捷鍵:ctrl + shift + x 使用插件插件
2.按住ctrl + shift ,而後移動鼠標就能夠選擇頁面上的元素,仍是很是方便的被選中的元素會顯示不一樣的顏色,query窗口中顯示的就是xpath的值,選完之後放開ctrl 和shift鍵就能夠了線程
打開以後如圖所示:是一個黑色的窗體,左邊顯示query,右邊顯示result中間件
3.xpath helper除了能夠獲取頁面元素的xpath地址,也能夠驗證用戶本身寫的xpath地址是否正確。query窗口能夠手動輸入和修改xpath地址。blog
如何判斷輸入的地址是正確的呢:
一、result窗口有顯示對應的內容,而不是null
二、頁面中對應的元素會變成黃色
複合以上兩點,說明xpath寫對了