Hutool之正則表達式工具類——ReUtil

時間 2019-12-04

原文原文鏈接

前言

在文本處理中，正則表達式幾乎是全能的，可是Java的正則表達式有時候處理一些事情仍是有些繁瑣，因此我封裝了部分經常使用功能。就好比說我要匹配一段文本中的某些部分，咱們須要這樣作：java

<!-- lang: java -->
Pattern pattern = Pattern.compile(regex, Pattern.DOTALL);
Matcher matcher = pattern.matcher(content);
if (matcher.find()) {
    String result= matcher.group();
}

其中牽涉到多個對象，想用的時候真心記不住。好吧，既然功能如此經常使用，我就封裝一下：git

<!-- lang: java -->
/**
* 得到匹配的字符串
* 
* [@param](https://my.oschina.net/u/2303379) pattern 編譯後的正則模式
* [@param](https://my.oschina.net/u/2303379) content 被匹配的內容
* [@param](https://my.oschina.net/u/2303379) groupIndex 匹配正則的分組序號
* [@return](https://my.oschina.net/u/556800) 匹配後獲得的字符串，未匹配返回null
*/
public static String get(Pattern pattern, String content, int groupIndex) {
    Matcher matcher = pattern.matcher(content);
    if (matcher.find()) {
        return matcher.group(groupIndex);
    }
    return null;
}

/**
* 得到匹配的字符串
* 
* [@param](https://my.oschina.net/u/2303379) regex 匹配的正則
* @param content 被匹配的內容
* @param groupIndex 匹配正則的分組序號
* @return 匹配後獲得的字符串，未匹配返回null
*/
public static String get(String regex, String content, int groupIndex) {
    Pattern pattern = Pattern.compile(regex, Pattern.DOTALL);
    return get(pattern, content, groupIndex);
}

其餘方法介紹

其餘方法我作了一個Demo類，方便你們參考，地址：github

https://gitee.com/loolly/hutool/blob/v4-master/hutool-core/src/main/java/cn/hutool/core/util/ReUtil.java正則表達式

Demo代碼

<!-- lang: java -->
package com.xiaoleilu.hutool.demo;

import java.util.ArrayList;
import java.util.List;

import org.slf4j.Logger;

import com.xiaoleilu.hutool.Log;
import com.xiaoleilu.hutool.ReUtil;

/**
 * 正則表達式工具類Demo
 * @author Looly
 *
 */
public class ReUtilDemo {
    private final static Logger log = Log.get();
    
    public static void main(String[] args) {
        String content = "ZZZaaabbbccc中文1234";
        
        //get demo 正則查找匹配的第一個字符串
        String resultGet = ReUtil.get("\\w{2}", content, 0);
        log.debug("get: {}", resultGet);
        
        log.debug("---------------------------------------------------------");
        
        //抽取多個分組而後把它們拼接起來
        String resultExtractMulti = ReUtil.extractMulti("(\\w)aa(\\w)", content, "$1-$2");
        log.debug("extractMulti: {}", resultExtractMulti);
        
        log.debug("---------------------------------------------------------");
        
        //抽取多個分組而後把原文匹配到位置以前的內容都刪除
        String[] contents = new String[]{content};
        String resultExtractMultiAndDelPre = ReUtil.extractMultiAndDelPre("(\\w)aa(\\w)", contents, "$1-$2");
        log.debug("extractMultiAndDelPre: content: {}, extract: {}", contents[0], resultExtractMultiAndDelPre);
        
        log.debug("---------------------------------------------------------");
        
        //刪除第一個匹配到的內容
        String resultDelFirst = ReUtil.delFirst("(\\w)aa(\\w)", content);
        log.debug("delFirst: {}", resultDelFirst);
        
        log.debug("---------------------------------------------------------");
        
        //刪除第一個匹配到的內容以及以前的文本
        String resultDelPre = ReUtil.delPre("(\\w)aa(\\w)", content);
        log.debug("delPre: {}", resultDelPre);
        
        log.debug("---------------------------------------------------------");
        
        //查找全部匹配文本
        List<String> resultFindAll = ReUtil.findAll("\\w{2}", content, 0, new ArrayList<String>());
        log.debug("findAll: {}", resultFindAll);
        
        log.debug("---------------------------------------------------------");
        
        //找到匹配的第一個數字
        Integer resultGetFirstNumber= ReUtil.getFirstNumber(content);
        log.debug("getFirstNumber: {}", resultGetFirstNumber);
        
        log.debug("---------------------------------------------------------");
        
        //格式是否符合Ipv4格式
        log.debug("isIpv4: {}", ReUtil.isIpv4("127.0.0.1"));
        
        log.debug("---------------------------------------------------------");
        
        //給定字符串是否匹配給定正則
        log.debug("isMatch: {}", ReUtil.isMatch("\\w+[\u4E00-\u9FFF]+\\d+", content));
        
        log.debug("---------------------------------------------------------");
        
        //經過正則查找到字符串，而後把匹配到的字符串加入到replacementTemplate中，$1表示分組1的字符串
        log.debug("replaceAll: {}", ReUtil.replaceAll(content, "(\\d+)", "->$1<-"));
        
        log.debug("---------------------------------------------------------");
        
        //轉義給定字符串，爲正則相關的特殊符號轉義
        log.debug("replaceAll: {}", ReUtil.escape("我有個$符號{}"));
        
        log.debug("---------------------------------------------------------");
    }
}