正則表達式提取字符串內全部的img標籤下的src路徑

/**
 * 提取字符串內全部的img標籤下的src
 * @param content
 * @return
 */
public static List<String> getImg(String content){
	 String regex;     
	   List<String> list = new ArrayList<String>();
	   //提取字符串中的img標籤
	   regex = "<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>";     
	   Pattern pa = Pattern.compile(regex, Pattern.DOTALL);     
	   Matcher ma = pa.matcher(content);     
	   while (ma.find())     
	   {  
	    //提取字符串中的src路徑
	    Matcher m = Pattern.compile("src=\"?(.*?)(\"|>|\\s+)").matcher(ma.group());
	    while(m.find())
	    {
	    	if("http".equals(m.group(1).substring(0, 4))){//只提取http開頭的圖片地址
	    		//System.out.println(m.group(1));
	    		list.add(m.group(1));
	    	}
	    }
	   }
	   return list;
	}
相關文章
相關標籤/搜索