如何從網頁中下載圖片

 

若是作爲爬蟲頗有必要從網頁中下載圖片到本地,那麼咱們利用jsoup來進行該操做,jsoup 是一個很不錯的html解析器。
網頁中下載圖片須要這麼兩步操做
1.獲取絕對路徑
不少網頁中用的是相對路徑,所以獲取圖片的絕對路徑很重要
方法一:咱們就利用jsoup來獲取
Element p_w_picpath = document.select("img").first();
String url = p_w_picpath.absUrl("src");
// url = http://www.example.com/p_w_picpaths/chicken.jpg
或者
String url = p_w_picpath.attr("abs:src");
他們的前提利用connect方式獲取而不是文件方式
Document doc = Jsoup.connect("http://jsoup.org").get();
 
Element link = doc.select("a").first();
String relHref = link.attr("href"); // == "/"
String absHref = link.attr("abs:href"); // "http://jsoup.org/"
 
方法二:利用jdk中url
URL url  = new URL("http://www.example.com/index.html");
URI uri = url.toURI();
System.out.println(uri.resolve("p_w_picpaths/chicken.jpg").toString());
 
2.第二步則就是下載圖片
URL   url   =   new   URL( "圖片地址"); 
URLConnection   uc   =   url.openConnection(); 
InputStream   is   =   uc.getInputStream(); 
File   file   =   new   File( "本地路徑 "); 
FileOutputStream   out   =   new   FileOutputStream(file); 
int   i=0; 
while   ((i=is.read())!=-1)   { 
out.write(i); 
is.close();
相關文章
相關標籤/搜索