前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

今天,小編給你們帶來的教程爲:前嗅ForeSpider腳本教程-數據抽取腳本實戰教程的,應用場景,數據在源碼的html標籤裏寫腳本。具體內容以下:html

一.應用場景ide

當所須要的數據字段大部分須要配置腳本時,可將全部字段的抽取統一放在數據抽取腳本中。htm

可能用到的類:DOM、EXTRACT。blog

配置方法:選中數據抽取,點擊「腳本窗口」,點擊建立按鈕。便可在新建的代碼框內輸入代碼。教程

二.數據在源碼的html標籤裏寫腳本源碼

目標數據可在源碼中查找到。在目標網頁右鍵,選擇「查看源代碼」,鍵盤點擊「ctrl+F」,查找目標數據所在位置。class

1.數據須要循環配置

場景:目標數據集中分佈,如評論數據。搜索

2.數據不循環循環

場景:目標數據分散分佈。

示例:獲取聚美優品網,關鍵詞搜索以後的列表頁的頁數。

查看源碼,得知在源碼中的位置。

由圖可知,頁碼所在<div>的class屬性值惟一,因此能夠根據class屬性值找到該<div>。

腳本實例:

var div = DOM.FindClass(「head_pageInfo」);  //獲取目標數據節點位置

var num=DOM.GetTextAll(div).Middle("/",頁).ToInt();  //獲取目標數據,並轉爲int型

相關文章
相關標籤/搜索