在文本處理中,正則表達式幾乎是全能的,可是Java的正則表達式有時候處理一些事情仍是有些繁瑣,因此我封裝了部分經常使用功能。就好比說我要匹配一段文本中的某些部分,咱們須要這樣作:java
<!-- lang: java --> Pattern pattern = Pattern.compile(regex, Pattern.DOTALL); Matcher matcher = pattern.matcher(content); if (matcher.find()) { String result= matcher.group(); }
其中牽涉到多個對象,想用的時候真心記不住。好吧,既然功能如此經常使用,我就封裝一下:git
<!-- lang: java --> /** * 得到匹配的字符串 * * [@param](https://my.oschina.net/u/2303379) pattern 編譯後的正則模式 * [@param](https://my.oschina.net/u/2303379) content 被匹配的內容 * [@param](https://my.oschina.net/u/2303379) groupIndex 匹配正則的分組序號 * [@return](https://my.oschina.net/u/556800) 匹配後獲得的字符串,未匹配返回null */ public static String get(Pattern pattern, String content, int groupIndex) { Matcher matcher = pattern.matcher(content); if (matcher.find()) { return matcher.group(groupIndex); } return null; } /** * 得到匹配的字符串 * * [@param](https://my.oschina.net/u/2303379) regex 匹配的正則 * @param content 被匹配的內容 * @param groupIndex 匹配正則的分組序號 * @return 匹配後獲得的字符串,未匹配返回null */ public static String get(String regex, String content, int groupIndex) { Pattern pattern = Pattern.compile(regex, Pattern.DOTALL); return get(pattern, content, groupIndex); }
其餘方法我作了一個Demo類,方便你們參考,地址:github
<!-- lang: java --> package com.xiaoleilu.hutool.demo; import java.util.ArrayList; import java.util.List; import org.slf4j.Logger; import com.xiaoleilu.hutool.Log; import com.xiaoleilu.hutool.ReUtil; /** * 正則表達式工具類Demo * @author Looly * */ public class ReUtilDemo { private final static Logger log = Log.get(); public static void main(String[] args) { String content = "ZZZaaabbbccc中文1234"; //get demo 正則查找匹配的第一個字符串 String resultGet = ReUtil.get("\\w{2}", content, 0); log.debug("get: {}", resultGet); log.debug("---------------------------------------------------------"); //抽取多個分組而後把它們拼接起來 String resultExtractMulti = ReUtil.extractMulti("(\\w)aa(\\w)", content, "$1-$2"); log.debug("extractMulti: {}", resultExtractMulti); log.debug("---------------------------------------------------------"); //抽取多個分組而後把原文匹配到位置以前的內容都刪除 String[] contents = new String[]{content}; String resultExtractMultiAndDelPre = ReUtil.extractMultiAndDelPre("(\\w)aa(\\w)", contents, "$1-$2"); log.debug("extractMultiAndDelPre: content: {}, extract: {}", contents[0], resultExtractMultiAndDelPre); log.debug("---------------------------------------------------------"); //刪除第一個匹配到的內容 String resultDelFirst = ReUtil.delFirst("(\\w)aa(\\w)", content); log.debug("delFirst: {}", resultDelFirst); log.debug("---------------------------------------------------------"); //刪除第一個匹配到的內容以及以前的文本 String resultDelPre = ReUtil.delPre("(\\w)aa(\\w)", content); log.debug("delPre: {}", resultDelPre); log.debug("---------------------------------------------------------"); //查找全部匹配文本 List<String> resultFindAll = ReUtil.findAll("\\w{2}", content, 0, new ArrayList<String>()); log.debug("findAll: {}", resultFindAll); log.debug("---------------------------------------------------------"); //找到匹配的第一個數字 Integer resultGetFirstNumber= ReUtil.getFirstNumber(content); log.debug("getFirstNumber: {}", resultGetFirstNumber); log.debug("---------------------------------------------------------"); //格式是否符合Ipv4格式 log.debug("isIpv4: {}", ReUtil.isIpv4("127.0.0.1")); log.debug("---------------------------------------------------------"); //給定字符串是否匹配給定正則 log.debug("isMatch: {}", ReUtil.isMatch("\\w+[\u4E00-\u9FFF]+\\d+", content)); log.debug("---------------------------------------------------------"); //經過正則查找到字符串,而後把匹配到的字符串加入到replacementTemplate中,$1表示分組1的字符串 log.debug("replaceAll: {}", ReUtil.replaceAll(content, "(\\d+)", "->$1<-")); log.debug("---------------------------------------------------------"); //轉義給定字符串,爲正則相關的特殊符號轉義 log.debug("replaceAll: {}", ReUtil.escape("我有個$符號{}")); log.debug("---------------------------------------------------------"); } }