今天,小編給你們帶來的教程爲:前嗅ForeSpider腳本教程-連接抽取中,連接在POST請求裏寫腳本的實戰教程。具體內容以下:json
當連接地址在源碼中不存在,存在於post請求中時,須要使用瀏覽器的開發者工具來查找連接數據。數組
1.連接須要循環瀏覽器
場景:一組連接存在於JSON的某個數組中。ide
示例:採集豆瓣電影,列表頁的電影連接。工具
查看源文件可知,源文件中只有一部分數據,而下拉列表出現的其餘電影信息不存在源碼中,此時咱們須要在請求的響應正文中查找數據。在該頁面右鍵點擊「審查元素」,下拉,點擊「加載更多」,出現一個請求包,查看Response,發現連接地址存在於,返回正文中。post
將Response中的信息粘貼到json查看器中,以notepad++插件「JSON Viewer」爲例,定位數據存在路徑。url
腳本實例:插件
var urs = 「https://movie.douban.com/j/search_subjects?type=movie&t ag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=60」;code
var groc = EXTRACT.OpenDoc(CHANN,urs,0);blog
if(groc){
var jsonStr = groc.GetDom().GetSource().ToStr();
jScript js;
var json = js.RunJson(jsonStr);
var arr = json.subjects;
for(int i=0;i<arr.size;i++)
{ url u; u.title=」」; u.urlname=arr[i].url; u.entryid=CHANN.id; u.tmplid=2; RESULT.AddLink(u); }
}
2.不循環
場景:少數連接是JSON的某個鍵值。
示例:暫無。