基於Webmagic的Java爬蟲（二）爬取當前頁內容

時間 2021-01-14

原文原文鏈接

基於Webmagic的Java爬蟲（二）一、目標：獲取（電影天堂）電影詳情頁鏈接，再獲取電影名字和下載地址，並在控制檯輸出。二、步驟：爬取(電影天堂：https://mp.csdn.net) 首頁電影詳情的所有鏈接。要爬取的內容：按 F12 查看頁面的源碼，寫出電影詳情頁正則：//div[@class=‘co_content4’]/ul/a[@href] 點擊電影詳情鏈接，觀察地址欄，

>>阅读原文<<