1.3 爬蟲架構

Python爬蟲架構介紹 1. URL管理器管理着所有URL,把地址交給網頁下載器去下載。 2. 下載的內容是一個String,由解析器 分析出有用的數據存儲。 3. 解析器還可以解析出 String中的URL再交給URL管理器,進行下一步爬取。 爬蟲動態運行流程
相關文章
相關標籤/搜索