(一)實現爬蟲的簡單思路

文章目錄 (一)寫爬蟲的一些套路 1. 準備url 1.1 準備start_url (1) url地址規律不明顯,或總數不確定時 (2)通過代碼提取下一頁的url 1)xpath(重點) 2)尋找url地址,部分參數在當前的響應中,比如,當前頁碼和總的頁碼數在當前的響應中 1.2 準備 url_list (1) 頁碼總數明確 (2)url地址規律明顯 2. 發送請求,獲取響應 2.1 添加隨機的U
相關文章
相關標籤/搜索