Jsoup爬蟲學習--獲取智聯招聘(老網站)的全國java職位信息,爬取10頁,輸出php
職位名稱*****公司名稱*****職位月薪*****工做地點*****發佈日期java
import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class JsoupHtml { public static void main(String[] args) { new JsoupHtml().getZhiLianWork(); } public void getZhiLianWork(){ try { for (int i=0;i<10;i++) { System.out.println("*********開始遍歷第"+(i+1)+"頁的求職信息*********"); Document doc = Jsoup.connect("https://sou.zhaopin.com/jobs/searchresult.ashx?jl=-1&kw=java&p="+(i+1)+"&isadv=0").get(); Element content = doc.getElementById("newlist_list_content_table"); Elements zwmcEls = content.getElementsByClass("zwmc"); Elements gsmcEls = content.getElementsByClass("gsmc"); Elements zwyxEls = content.getElementsByClass("zwyx"); Elements gzddEls = content.getElementsByClass("gzdd"); Elements gxsjEls = content.getElementsByClass("gxsj"); for(int j = 0;j<zwmcEls .size();j++){ System.out.println( zwmcEls.get(j).tagName("a").text()+"*****"+gsmcEls.get(j).tagName("a").text()+ "*****"+zwyxEls.get(j).tagName("a").text()+"*****"+gzddEls.get(j).tagName("a").text()+ "*****"+gxsjEls.get(j).tagName("a").text()); System.out.println(); } System.out.println("*********結束遍歷第"+(i+1)+"頁的求職信息*********"); } } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
輸出結果示例:node
產品經理??*****微貸(杭州)金融信息服務有限公司*****4500-8000*****杭州-濱江區*****置頂學習
軟件工程師??*****重慶建工信息技術有限公司*****5000-7000*****重慶*****置頂網站
php高級研發工程師??*****西安聯合創想電子商務有限公司*****15000-30000*****西安*****置頂spa