採集字段:數據庫
用戶、圖片一、圖片2 、圖片三、 評論內容、 顏色及尺碼、 最新評論時間工具
採集工具:post
后羿採集軟件網站
採集結果預覽:3d
下面咱們來詳細介紹一下如何使用流程圖模式,採集淘寶商品的評論,咱們以淘寶店鋪毛菇小象家的毛呢短褲的評論爲例,具體步驟以下:htm
步驟一:新建採集任務blog
一、複製淘寶商品評論的網頁地址(須要搜索結果頁的網址,而不是首頁的網址)教程
二、新建流程圖模式採集任務圖片
步驟二:配置採集規則get
一、點擊評論
輸入網址後,咱們進入淘寶寶貝的詳情頁,此時頁面上出現的登陸界面咱們能夠點擊關閉,在詳情頁上能夠看到評論數可是看不到具體的評論內容,咱們須要點擊評論,而後在左上角跳轉出來的提示框中選擇「點擊該元素」。
二、設置提取字段數據
跳轉到評論界面後,咱們點擊網頁上的評論字段,在左上角的操做提示框內選擇提取所有元素。
提取出評論列表頁上的字段以後,咱們能夠右擊字段進行相關設置,包括修改字段名稱、增減字段、處理數據等。
點此瞭解更多關於提取字段組件的內容。
咱們須要採集評論內容、用戶名稱、評論發佈時間及評論圖片等信息,字段設置效果以下:
三、設置下一頁
咱們採集出了單頁的評論數據,如今須要採集下一頁的數據,咱們點擊頁面上的「下一頁」按鈕,在左上角出現的操做提示框內選擇「循環點擊下一頁」。
點此瞭解更多關於翻頁的內容。
步驟四:設置並啓動採集任務
點擊「保存並啓動」按鈕,可在彈出的頁面中進行一些高級設置,包括定時啓動、自動入庫和下載圖片,本次示例中未使用到這些功能,直接點擊「啓動」運行爬蟲工具。
步驟五:導出並查看數據
數據採集完成後,咱們能夠查看和導出數據,軟件支持多種導出方式(手動導出到本地、手動導出到數據庫、自動發佈到數據庫、自動發佈到網站)和導出文件的格式(EXCEL、CSV、HTML和TXT),咱們選擇本身須要方式和文件類型,點擊「確認導出」。
再爲您推薦幾個關於電商的採集教程: