如何從網頁中下載圖片

時間 2020-04-30

標籤如何網頁下載圖片欄目 HTML 简体版

原文原文鏈接

若是作爲爬蟲頗有必要從網頁中下載圖片到本地，那麼咱們利用jsoup來進行該操做，jsoup 是一個很不錯的html解析器。

網頁中下載圖片須要這麼兩步操做

1.獲取絕對路徑

不少網頁中用的是相對路徑，所以獲取圖片的絕對路徑很重要

方法一：咱們就利用jsoup來獲取

Element p_w_picpath = document.select("img").first();

String url = p_w_picpath.absUrl("src");

// url = http://www.example.com/p_w_picpaths/chicken.jpg

或者

String url = p_w_picpath.attr("abs:src");

他們的前提利用connect方式獲取而不是文件方式

Document doc = Jsoup.connect("http://jsoup.org").get();

Element link = doc.select("a").first();

String relHref = link.attr("href"); // == "/"

String absHref = link.attr("abs:href"); // "http://jsoup.org/"

方法二：利用jdk中url

URL url = new URL("http://www.example.com/index.html");

URI uri = url.toURI();

System.out.println(uri.resolve("p_w_picpaths/chicken.jpg").toString());

2.第二步則就是下載圖片

URL url = new URL( "圖片地址");

URLConnection uc = url.openConnection();

InputStream is = uc.getInputStream();

File file = new File( "本地路徑 ");

FileOutputStream out = new FileOutputStream(file);

int i=0;

while ((i=is.read())!=-1) {

out.write(i);

}

is.close();

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。