參考:http://blog.csdn.net/su_tianbiao/article/details/52735399html
內容:chrome
每個寫爬蟲、或者是作網頁分析的人,相信都會由於在定位、獲取xpath路徑上花費大量的時間,甚至有時候當爬蟲框架成熟以後,基本上主要的時間都花費在了頁面的解析上。在沒有這些輔助工具的日子裏,咱們只能經過搜索html源代碼,定位一些id去找到對應的位置,很是的麻煩,並且常常出錯。這裏介紹一個chrome的xpath輔助插件給你們。瀏覽器
先給到下載連接:xpath-helper框架
安裝好以後,咱們從新打開瀏覽器,按ctrl+shift+x就能調出xpath-helper框了。界面以下:工具
若是咱們要查找某一個、或者某一塊元素的xpath路徑,能夠按住shift,並移動到這一塊中,上面的框就會顯示這個元素的xpath路徑,右邊則會顯示解析出的文本內容,而且咱們能夠本身改動xpath路徑,程序也會自動的顯示對應的位置,能夠很方便的幫助咱們判斷咱們的xpath語句是否書寫正確。.net
雖然這個小插件使用很是方便,但它也不是萬能的,有兩個問題:插件
1.XPath Helper 自動提取的 XPath 都是從根路徑開始的,這幾乎必然致使 XPath 過長,不利於維護;htm
2.當提取循環的列表數據時,XPath Helper 是使用的下標來分別提取的列表中的每一條數據,這樣並不適合程序批量處理,仍是須要人爲修改一些相似於*標記等。blog
不過,合理的使用Xpath,仍是能幫咱們省下不少時間的!get