字段取值腳本是字段的取值類型選擇腳本取值時,須要配置的腳本。這一步是經過腳原本獲取字段的填充值。數據庫
注意:一旦有了字段取值腳本,則字段處理腳本將失效。dom
一.可用全局對象(只讀)this
EXTRACT: 當前採集引擎[ 對象類型: extractor ]url
DATADB: 當前鏈接的數據庫[ 對象類型: dataBase ]code
RESULT: 當前結果集對象[ 對象類型: result ]對象
URL: 當前採集的連接對象[ 對象類型: url ]文檔
URLTEXT : 描述當前連接採集的全部狀態及屬性的對象[ 對象類型: urltext ]字符串
DOC: 當前採集的文檔對象[ 對象類型: grabDoc ]源碼
DOM: 當前採集文檔的dom對象[ 對象類型: dom ]string
ITEM: 當前dom樹被取值節點[ 對象類型: domItem ]
TMPL: 當前文檔模板對象[ 對象類型: tmplTmpl ]
DATA: 當前數據抽取對象[ 對象類型: tmplData ]
REC: 當前記錄集對象[ 對象類型: record ]
二.this對象
當前數據字段抽取 [ tmplVal ] 對象。
三.腳本返回值
必須返回獲取的數據值 [返回類型:string]
四.示例
<div class="lumn_left01"><a>商品大類</a>><a><a>商品列表</a>><a>商品品牌</a>></div> 【網頁源碼】
如下腳本將取數據中全部文本:
return DOM.GetTextAll(DOM.FindClass("lumn_left01",div));
取出的結果爲:
商品大類>商品列表>商品品牌>
註釋:
GetTextAll:取出其中全部的文本。
FindClass:經過標籤class屬性值查找標籤節點。
Right: 返回字符串右邊的字符串。
如下腳本直接取值爲當前的dom節點全部文本:
return DOM.GetText(ITEM);