colly 使用多個收集器 ##8

時間 2019-11-13

標籤 colly 使用多個收集简体版

原文原文鏈接

使用多個收集器

若是任務足夠複雜或具備不一樣類型的子任務，建議爲一個抓取工做使用多個收集器。coursera course scraper就是一個很好的例子，它使用了兩個收集器——一個解析列表視圖並處理分頁，另外一個收集課程的詳細信息。dom

注意：使用收集器。ID在調試中區分不一樣的收集器函數

克隆收集器

若是收集器具備相似的配置，能夠使用收集器的Clone()方法。Clone()複製具備相同配置但沒有附加回調的收集器。spa

c := colly.NewCollector(
	colly.UserAgent("myUserAgent"),
	colly.AllowedDomains("foo.com", "bar.com"),
)
// Custom User-Agent and allowed domains are cloned to c2
c2 := c.Clone()

在收集器之間傳遞自定義數據

使用collector的Request()函數能夠與其餘收集器共享上下文。調試

共享上下文的例子:blog

c.OnResponse(func(r *colly.Response) {
	r.Ctx.Put(r.Headers.Get("Custom-Header"))
	c2.Request("GET", "https://foo.com/", nil, r.Ctx, nil)
})

1. colly 配置 ##4
2. colly 實踐 ##5
3. 用Golang寫爬蟲(六) - 使用colly
4. IDEA-debug使用大全-個人收集
5. jvm垃圾收集器-Serial收集器、ParNew收集器、Parallel收集器
6. colly Crawler 配置 ##9
7. jvm(9) -- cms收集器、G1收集器
8. 使用Fluentd收集Docker容器日誌
9. seajs使用收集
10. notepad++使用收集
更多相關文章...
• Docker 容器使用 - Docker教程
• Docker 鏡像使用 - Docker教程
• Java 8 Stream 教程
• Composer 安裝與使用

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。