前嗅ForeSpider腳本教程-數據抽取腳本實戰教程

時間 2019-11-13

標籤 forespider 腳本教程數據抽取實戰简体版

原文原文鏈接

今天，小編給你們帶來的教程爲：前嗅ForeSpider腳本教程-數據抽取腳本實戰教程的，應用場景，數據在源碼的html標籤裏寫腳本。具體內容以下：html

一.應用場景ide

當所須要的數據字段大部分須要配置腳本時，可將全部字段的抽取統一放在數據抽取腳本中。htm

可能用到的類：DOM、EXTRACT。blog

配置方法：選中數據抽取，點擊「腳本窗口」，點擊建立按鈕。便可在新建的代碼框內輸入代碼。教程

二.數據在源碼的html標籤裏寫腳本源碼

目標數據可在源碼中查找到。在目標網頁右鍵，選擇「查看源代碼」，鍵盤點擊「ctrl+F」，查找目標數據所在位置。class

1.數據須要循環配置

場景：目標數據集中分佈，如評論數據。搜索

2.數據不循環循環

場景：目標數據分散分佈。

示例：獲取聚美優品網，關鍵詞搜索以後的列表頁的頁數。

查看源碼，得知在源碼中的位置。

由圖可知，頁碼所在<div>的class屬性值惟一，因此能夠根據class屬性值找到該<div>。

腳本實例：

var div = DOM.FindClass(「head_pageInfo」); //獲取目標數據節點位置

var num=DOM.GetTextAll(div).Middle("/",頁).ToInt(); //獲取目標數據，並轉爲int型

相關標籤/搜索