scrapy關於tbody標籤的問題

時間 2021-01-02

原文原文鏈接

今天在爬取網頁時，當爬取表格(table) 的內容時，發現用 xpath helper 獲取正常，程序卻解析不到。原因是：瀏覽器會在table標籤下添加tbody 在chrome、火狐測試都有這個情況。出現這種原因是因爲瀏覽器會對html文本進行一定的規範化下圖這個是xpath heper 獲取的下圖是源碼查看到的對比發現，審查元素中多了tbody標籤解決方法：使用scrapy時將分析

>>阅读原文<<