python 爬蟲入門 練習五 代理ip的獲取

得到西祠代理 https://www.xicidaili.com/nn/1 任務 得到 代理html 遇到的問題 //*[@id=「ip_list」]/tbody/tr[2]/td[2] chrome 瀏覽器 直接得到xpath 可是運行後得到是空列表web 處理方式 瀏覽器會對html文本進行必定的規範化,因此會自動在路徑中加入tbody,致使讀取失敗,在此處直接在路徑中去除tbody便可。 醉
相關文章
相關標籤/搜索