Rendertron:谷歌 Chrome 新的 headless 模式又貢獻了一個新的技巧

摘自:https://zhuanlan.zhihu.com/p/31670033服務器

Rendertron:JavaScript Web 富應用的一個老問題是如何使這些頁面的動態渲染部分可供搜索引擎檢索。爲此開發人員採用了各類各樣的技巧,包括使用 React.js 的服務端渲染,外部服務或預渲染內容。如今谷歌 Chrome 新的 headless 模式又貢獻了一個新的技巧—— Rendertron,即 Chrome的headless 渲染解決方案。它在一個 Docker 容器中封裝了一個 headless 的 Chrome 實例,能夠做爲獨立的HTTP服務器來部署。沒法渲染JavaScript的爬蟲機器人能夠被路由到此服務器來進行渲染。 雖然開發人員也能夠部署本身的 headless Chrome代理並配置相關的路由機制,但 Rendertron 簡化了配置和部署過程,並提供了令爬蟲機器人進行檢測和路由的中間件示例代碼。併發

谷歌 Chrome 新的 headless 模式:less

有一個業務,就是服務器端抓圖(把一件事簡單作出來容易,把一件事作到極致真不容易):搜索引擎

有兩種思路:阿里雲

用Selenium啓動FireFox(Chrome),要想處理多用戶併發問題,解決辦法就是用Selenium Grid,阿里雲端加機器,就會增長成本。如今能夠考慮啓動多個無頭模式的Chrome,來提升一些效率了。代理

也能夠改造F2Test這個方案,可是須要熟悉NodeJs,而且須要作大量的改造工做,時間成本較高。中間件

相關文章
相關標籤/搜索