下面帶領你們來建立一個本身採集規則。html
視頻版本 https://v.youku.com/v_show/id_XNDI5MTQ2NzkwMA==.html?spm=a2h3j.8428770.3416059.1web
核心只須要填好五個參數學習
地址: 顧名思義, 是咱們你們目標頁面的地址 測試
採集範圍: 你要採集目標頁面的哪一塊數據網站
採集規則: 你要怎麼採spa
詳情采集範圍: 同上debug
詳情採集規則: 同上視頻
核心五部曲:htm
採集目標地址: https://xx.qq.com/webplat/info/news_version3/154/2233/3889/m2702/list_1.shtmlblog
右鍵 檢查 便可看到頁面代碼
黃色區域就是咱們要採集的範圍,因此咱們採集範圍這麼寫
採集範圍: .down-nr>ul>li
解釋: 加上 ul li 會循環的採集每個塊。達到了咱們列表採集的目的
採集規則: a:eq(1)
解釋: a 選中a標籤 :eq(1) 是選中 li下面第1個a標籤, 注: 數字是從0開始的。 第一個a是0 第二個a是1 懂了吧?
詳情采集範圍 .sub-cont
解釋: 看圖 .sub-cont 包括了 標題和內容。 因此咱們選擇這個區域
詳情采集規則 title = .n_title
詳情采集規則 content = .sub-nr
解釋: 看圖 .n_title 是文章的標題
解釋: 看圖 .sub-nr 使文章的內容
完成的配置
解釋一下 規則名 目前默認三個值暫時夠用
標籤過濾怎麼用呢?給你們描述一下
看這裏這個只是一部分。你們自行百度,因此說胖鼠採集過濾功能 很強大。
這個例子在導入默認例子按鈕裏面有。你們能夠導入本身品嚐!
還有一個debug功能要告訴你們
給你們實戰一下
上面這個debug例子是 debug 列表頁面的連接。你們要使用debug功能 測試詳情頁面的 標題 內容是否都獲取正常了 才保存這個匹配
一次花10分鐘 配一次 除了目標網站改版 就能夠一直使用。但願你們花一點點時間學習一下。
有什麼不懂得來找胖鼠把。祝你們用的開心用的愉快!
胖鼠採集: QQ羣1: 454049736
胖鼠採集: QQ羣2: 846069514