網絡爬蟲之Splash負載均衡配置

如果我們用 Splash 來做 JavaScript 動態渲染的頁面的抓取的話,如果爬取的量非常大,任務非常多,如果我們用一個 Splash 服務來處理的話未免壓力太大了,所以我們可以考慮搭建一個負載均衡器來把壓力分散到各個服務器上,這樣相當於多臺機器多個服務共同參與任務的處理,可以減小單個 Splash 服務的壓力。 1. 配置Splash服務 要搭建 Splash 負載均衡首先我們需要有多個
相關文章
相關標籤/搜索