java爬取360doc中的pdf文檔

文章目錄 前言 網站分析 圖片獲取 合成pdf 前言 辛辛苦苦地找到了自己需要的答案,但卻無法下載,便打算分析一下網站將內容爬取出來,自己簡單實現了自己的需求,現在把代碼拿出來分享分享。 網站分析 好不容易在360doc中找到了完整版的答案,更值得高興的是,它的結構很簡單,圖片沒有百度文庫那樣反爬措施;這也是爲什麼我用java來爬取的原因之一。 從上圖不難看出,src指向的就是需要的圖片,而文件名
相關文章
相關標籤/搜索