Python Scrapy使用Selector、xpath、css選擇器提取數據

時間 2020-01-15

標籤 python scrapy 使用 selector xpath css 選擇器提取數據欄目 Python 简体版

原文原文鏈接

從頁面中提取數據的核心技術是HTTP文本解析，在Python 中經常使用如下模塊處理此類問題:css BeautifulSoup lxml 很是流行的HTTP解析庫，API 簡潔易用，但解析速度較慢。由C語言編寫的xml解析庫( libxml2)，解析速度更快，API相對複雜。 Scrapy綜合上述二者優勢實現了Selector 類，它是基於lxml庫構建的，並簡化了API接口。在Scrapy中

>>阅读原文<<