前嗅ForeSpider教程:採集表格/列表頁中的數據(不翻頁)

今天,小編來爲你們展現一下用前嗅ForeSpider採集表格/列表的操做流程,步驟以下:瀏覽器

第一步:新建任務
① 擊左上角「加號」新建任務,如圖1:
圖片描述ide

②在彈窗裏填寫採集地址,任務名稱如圖2:
圖片描述spa

③點擊下一步,選擇進行數據抽取仍是連接抽取,本次採集須要採集當前頁面列表中的全部內容,因此只需抽取列表數據便可,點擊「抽取數據」,如圖3:
圖片描述操作系統

第二步:建立/選擇表單
在ForeSpider爬蟲中,表單是能夠複用的,因此能夠在數據表單出直接選擇以前建過的表單,也能夠經過表單ID來進行查找並關聯數據表單。此處使用的是的前嗅的表單,如圖4
圖片描述3d

方法一:經過下拉菜單或表單ID選擇已有表單
方法二:點擊建立表單進入快速建表頁面,新建表單
方法三:點擊「採集配置」-「數據建表」,點擊採「採集表單」後面的如圖5
圖片描述code

第三步:配置表單
根據所需內容,配置表單字段(即表頭),此處配置了包括標題、做者、價格三個字段,表單如圖6
圖片描述
第四步:字段取值
取值方法:因爲此處活取的是列表頁的數據,因此能夠應用「識別列表」功能,直接取到列表數據,操做方法以下:
① 擊「前嗅」,按住ctrl+鼠標左鍵點擊任意一部份內容,如圖7,選中「操做系統」
圖片描述
②按住Shift+鼠標左鍵繼續點擊,直到點擊到選中整個第一條數據,如圖8
圖片描述blog

③在軟件的右下角能夠看到「識別列表」按鈕,此時點擊「識別列表」,如圖9,此時列表中的內容都已經選中。
圖片描述
④對每一個字段進行取值,方法依然是:按住Ctrl+鼠標左鍵,進行區域選擇,按住Shift+鼠標左鍵,擴大選擇區域。
如:funct字段
首先在左側點到price-cover字段上,在瀏覽器中對該字段進行取值.
<1>按住ctrl+鼠標左鍵,點擊「操做系統」
<3>點擊右下角「確認選區」
圖片描述
第五步:採集預覽
① 標右鍵點擊「數據抽取」,而後點擊「模板預覽」,如圖11
圖片描述
②預覽結果如圖12
圖片描述圖片

這樣網頁中的表格內容就採集下來了,若是你們在操做的過程當中遇到問題,能夠加入QQ技術交流羣:641067546;或者撥打技術顧問電話:022-2730 3760;
相關文章
相關標籤/搜索