前嗅ForeSpider腳本教程-連接抽取:連接在POST請求裏寫腳本

今天,小編給你們帶來的教程爲:前嗅ForeSpider腳本教程-連接抽取中,連接在POST請求裏寫腳本的實戰教程。具體內容以下:json

當連接地址在源碼中不存在,存在於post請求中時,須要使用瀏覽器的開發者工具來查找連接數據。數組

1.連接須要循環瀏覽器

場景:一組連接存在於JSON的某個數組中。ide

示例:採集豆瓣電影,列表頁的電影連接。工具

查看源文件可知,源文件中只有一部分數據,而下拉列表出現的其餘電影信息不存在源碼中,此時咱們須要在請求的響應正文中查找數據。在該頁面右鍵點擊「審查元素」,下拉,點擊「加載更多」,出現一個請求包,查看Response,發現連接地址存在於,返回正文中。post

將Response中的信息粘貼到json查看器中,以notepad++插件「JSON Viewer」爲例,定位數據存在路徑。url

腳本實例:插件

var urs = 「https://movie.douban.com/j/search_subjects?type=movie&t ag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=60」;code

var groc = EXTRACT.OpenDoc(CHANN,urs,0);blog

if(groc){

var jsonStr = groc.GetDom().GetSource().ToStr();

jScript js;

var json = js.RunJson(jsonStr);

var arr = json.subjects;

for(int i=0;i<arr.size;i++)

{
  url u;

  u.title=」」;

  u.urlname=arr[i].url;

  u.entryid=CHANN.id;

  u.tmplid=2;

  RESULT.AddLink(u);

 }

}

2.不循環

場景:少數連接是JSON的某個鍵值。

示例:暫無。

相關文章
相關標籤/搜索