python爬蟲(以國家菸草網新聞爲例)

國家菸草專賣局的網址是:http://www.tobacco.gov.cn/html/ 要爬取的內容爲各省級局的新聞。 大部分的省的新聞頁url都是有規律的,好比貴州省的是 http://www.tobacco.gov.cn/html/36/3617/361704_i.html 這個i就是頁數。 但有些省的新聞頁url在翻頁後是不變的,好比江西省,從第一頁到最後一頁一直都是http://jx.to
相關文章
相關標籤/搜索