支持JavaScript的網絡爬蟲

還有js邏輯的頁面,對 網絡爬蟲的信息抓取工做形成了很大障礙。DOM樹,只有執行了js的邏輯才能夠完整的呈現。而有的時候,有要對js修改後的dom樹進行解析。在搜尋了大 量資料後,發現了一個開源的項目cobra。cobra支持JavaScript引擎,其內置的JavaScript引擎是mozilla下的 rhino,利用rhino的API,實現了對嵌入在html的JavaScript的解釋執行。測
相關文章
相關標籤/搜索