python 爬蟲入門練習五代理ip的獲取

時間 2020-01-25

原文原文鏈接

得到西祠代理 https://www.xicidaili.com/nn/1 任務得到代理html 遇到的問題 //*[@id=「ip_list」]/tbody/tr[2]/td[2] chrome 瀏覽器直接得到xpath 可是運行後得到是空列表web 處理方式瀏覽器會對html文本進行必定的規範化，因此會自動在路徑中加入tbody，致使讀取失敗，在此處直接在路徑中去除tbody便可。醉

>>阅读原文<<