基於Webmagic的Java爬蟲(二)爬取當前頁內容

基於Webmagic的Java爬蟲(二) 一、目標: 獲取(電影天堂)電影詳情頁鏈接,再獲取電影名字和下載地址,並在控制檯輸出。 二、步驟: 爬取(電影天堂:https://mp.csdn.net) 首頁電影詳情的所有鏈接。 要爬取的內容: 按 F12 查看頁面的源碼,寫出電影詳情頁正則://div[@class=‘co_content4’]/ul/a[@href] 點擊電影詳情鏈接,觀察地址欄,
相關文章
相關標籤/搜索