RobustCrawler爬蟲架構

以「健壯性」爲第一原則的爬蟲框架,基於Python、RabbitMQ、Docker等開源組件爲基礎進行開發。· 整個基本的架構如下(還未包含全面): 設計理念 整個系統架構的原理是基於RabbitMQ的生產者-消費者的模型來進行爬蟲模塊之間的解耦以及序列化數據的傳遞,依靠RabbitMQ自身的集羣性、持久化、消息確認機制作爲爬蟲健壯性的根本基礎,將整個框架部署在Docker容器內,也是考慮到使用D
相關文章
相關標籤/搜索