今天,小編給你們帶來的教程爲:前嗅ForeSpider腳本教程中頻道腳本的應用場景以及腳本配置關鍵詞搜索的實戰教程。具體內容以下:html
一.頻道腳本使用場景瀏覽器
當須要手動建立採集源列表,或者徹底使用腳本採集數據時,在「頻道腳本」處,你可能用到的類爲extractor 、result。緩存
你能夠定義類的對象來使用其成員方法,也能夠使用EXTRACT、RESULT兩個全局對象。dom
關於這兩個類的詳細說明以及該場景的更多示例,能夠點擊「教程->腳本教程->腳本示例->頻道腳本」來查看相關內容。ide
二.腳本配置關鍵詞搜索工具
1.關鍵詞不含驗證碼post
場景:當一類連接中只須要替換一部分字符串,便可獲得目標連接。則能夠將這部分字符串做爲關鍵詞,添加頻道腳本,達到連接抽取的目的。 示例:暫無。this
2.關鍵詞含驗證碼url
場景:當經過可視化方式不能獲取驗證碼刷新事件時,須要手動尋找驗證碼刷新請求並填寫至相應輸入框,與此同時,添加驗證碼參數至參數列表。 示例:採集京東店鋪工商信息。orm
使用開發者工具(以搜狗瀏覽器爲例,在瀏覽器中按F12打開)抓包,在目標網頁右鍵點擊「審查元素」,選擇「NetWork」,先清空全部緩存信息,點擊驗證碼圖片,查找驗證碼刷新請求:
「https://mall.jd.com/sys/vc/createVerifyCode.html?random=0.10473700880101844 」。
能夠發現每次刷新驗證碼,請求連接中random參數的值都不一樣,則須要查找random生成的js事件。在網頁源碼中找到如下代碼。
填寫js刷新事件於文本框內,值得注意的是,只需修改this.src的值便可。 腳本實例:
var key = EXTRACT.GetSearch(this);
var form = key.Search();
url u;
var postData;
while(form){
var ocrCode = form.verifyCode;
u.urlname = "https://mall.jd.com/"+"showLicence-"+form.text+".html";
u.title = ocrCode;
u.entryid = this.id;
u.tmplid = 1;
postData = "verifyCode="+ocrCode;
var d = EXTRACT.OpenDoc(this,u.urlname,postData,0);
if(d){
this.Run(d,1);
EXTRACT.CloseDoc(d);
}
form = key.Search();
}
key.End();