Spring Boot + Java爬蟲 + 部署到Linux (2、Java爬蟲)

    這個小項目的主要(惟一)的業務就是一個爬蟲。這個爬蟲的功能就是爬取一個圖片網站的圖片。爬蟲相對是獨立的,若是隻想作一個簡單的爬蟲,也能夠參考。html     作爬蟲以前,先分析一下要爬的網站的結構。不要一上來就亂爬。因爲爬蟲的單位最大是一個圖集(image set),因此爬蟲的入口就設置爲圖集的地址。若是須要爬取更大的範圍,爬圖集也能夠做爲基礎的子程序。java     通常圖集的首地址
相關文章
相關標籤/搜索