python 使用pyquery提取字段遇到的一個坑

問題描述: 在抓取網頁內容時,利用requests,bs4等均能在結果中看到我想要的某字段,但是使用pyquery提取時卻沒有了 檢查後不是編碼的問題(結果中有正常顯示的漢字),也不是xhtml和html的問題 發現問題: 打開網頁源代碼,檢索「尾頁」,發現含有此字段的代碼被註釋了!!! 解決辦法: 將被註釋代碼提取出來,再利用pyquery轉化並提取,就可以了。
相關文章
相關標籤/搜索