使用YQL解決讓前端爬取網頁並解析

今天寫代碼的時候,爲了節省後端性能,就想用前端瀏覽器去爬取一個網頁並解析出其中的部份內容。html

由於涉及到跨域,因此就須要使用到JSONP,可是JSONP須要返回JSON格式,而咱們是須要爬取一個網頁的內容,因此直接使用JSONP將會報錯。因此咱們須要使用YQL來幫咱們將HTML內容解析成JSON格式。前端

 1 $.ajax({
 2    url: "http://query.yahooapis.com/v1/public/yql"
 3  , type:'jsonp'
 4  , data: {
 5      q: "select * from html where url=\"http://www.baidu.com/\"",
 6      format: "json"
 7    }
 8  , success:  (resp)=> {
 9      console.log(resp)
10    }
11 });

url是固定的,爲yql服務的地址,format是你想要解析的格式。q是YQL語句,其中的html是轉換前的格式。ajax

相關文章
相關標籤/搜索