學會XPath,讓你的數據採集效率提高20倍

爲什麼要寫XPath這個話題? 最近發現在用戶用八爪魚採集數據過程中遇到的問題,有80%以上的數據爬取遺漏、不準確的問題,都是因爲: 「XPath地址不準確」導致。 比如: A:「我設計好的規則,怎麼採集下來很多空白的數據?」 B:「我採集下來的數據,怎麼有那麼多不必要的字段?導致我後續清洗數據的工作量非常大。」 C:「爲何我採集的數據是錯的?」 等等…… 這些問題都源自採集數據過程中,數據**「
相關文章
相關標籤/搜索