同事把一個excel
表給我,裏面的數據大概有幾千的樣子吧。本身須要把裏面的數據一個一個拿出來作一個http
請求,對獲得的結果進行過濾,而後再寫到上面去。這是就涉及到用腳原本進行操做了,因而本身搞了一個Java
的腳本出來,裏面涉及到一些正則表達式,本身雖說會,可是一直對 Matcher
類中的group
方法 不太瞭解。網上的博客也沒有寫的特別清楚,因而有了此文。html
在java.util.regex
包下java
Pattern
(模式類) : 用來表達和陳述所要搜索模式的對象。Pattern.compile(pattern) pattern
也就是你寫的正則表達式Matcher
(匹配器類):真正影響搜索的對象。上面Pattern.compile(pattern)
獲得一個Pattern
對象 爲 r
。 r.matcher(line)
line
也便是你須要進行匹配的字符串 。這樣會獲得一個 Matcher
的對象。PatternSyntaxException
: 當遇到不合法的搜索模式時,會拋出例外。在有的語言中,一個反斜槓 \
就足以具備轉義的做用,可是Java中須要兩個 \\
反斜槓。表示轉義的做用。一些字符在正則表達式中的說明,意義。詳情可查看 runoob正則表達式
如今個人正則表達式爲 (//d+)([a-z]+)(//d+)
express
//d+
表示最少匹配一個數字[a-z]+
表示最少匹配一個字符"123ra9040 123123aj234 adf12322ad 222jsk22"
public static void main( String args[] ){
// 按指定模式在字符串查找
String line = "123ra9040 123123aj234 adf12322ad 222jsk22";
String pattern = "(\\d+)([a-z]+)(\\d+)";
// String pattern1 = "([\\u4E00-\\u9FA5]+|\\w+)";
// 建立 Pattern 對象
Pattern r = Pattern.compile(pattern);
// 如今建立 matcher 對象
Matcher m = r.matcher(line);
int i = 0;
// m.find 是否找到正則表達式中符合條件的字符串
while (m.find( )) {
// 拿到上面匹配到的數據
System.out.println("----i="+i);
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
System.out.println("Found value: " + m.group(3) );
i++;
System.out.println("|||||||");
System.out.println("");
}
}
複製代碼
輸出:spa
----i=0
Found value: 123ra9040
Found value: 123
Found value: ra
Found value: 9040
|||||||
----i=1
Found value: 123123aj234
Found value: 123123
Found value: aj
Found value: 234
|||||||
----i=2
Found value: 222jsk22
Found value: 222
Found value: jsk
Found value: 22
|||||||
複製代碼
group(0)
對應着 ((//d+)([a-z]+)(//d+))
123ra9040
group(2)
輸出的數據 是 group(0)
中所匹配的數據 也就是([a-z]+)
匹配到是數據 ra
group(3)
輸出的數據 是 group(0)
中所匹配的數據 也就是(//d+)
匹配到是數據 9040
Matcher
類中group(0)
表示正則表達式中符合條件的字符串。Matcher
類中 group(1)
表示正則表達式中符合條件的字符串中的第一個() 中的字符串。Matcher
類中 group(2)
表示正則表達式中符合條件的字符串中的第二個() 中的字符串。Matcher
類中 group(3)
表示正則表達式中符合條件的字符串中的第三個() 中的字符串。