少年,見你骨骼精奇,是百年一遇的練武奇才,你我又是有緣人,隨爲師修煉吧java
接上篇: 正則十八式-第一式:直搗黃龍編程
藏扇仙:"徒兒,悟得如何?"
捷特:"已忘去一半。"
半小時後...
藏扇仙:"如今呢?"
捷特:"已所有忘完。"
藏扇仙:"很好,如今爲師教你:正則十八式-第二式:控鶴擒龍"
複製代碼
藏扇仙:如今要求,匹配到下面的書名。
捷特:《.*》不就好了?
藏扇仙:你但可一試。
捷特: 怎麼會這樣?看來會默認儘量多的匹配。
藏扇仙:這就是貪婪模式。
複製代碼
捷特:師傅,何解?
藏扇仙:問號緊加限定尾,即非貪婪
複製代碼
捷特:師傅,這波穩,經過兩個限定符進行夾逼
藏扇仙:因此這招名爲-控鶴擒龍
複製代碼
藏扇仙:這是爲師的看家法寶之一,Java加工機。
捷特:早就聽聞師傅用Java代碼控制正則如行雲流水,可謂天下無敵。
藏扇仙:不止Java,凡是一門語言都和正則撇不開關係,不然就太挫了。如今教你提取信息。
複製代碼
regex
├── src
│ ├── main
│ │ ├── java
│ │ │ └── com
│ │ │ └── toly1994
│ │ │ └── regex
│ │ │ └── Parser.java
│ │ └── resources
│ │ └── regx
│ │ ├── book.txt
│ │ └── regx.txt
複製代碼
爲了使用方便,讀取文件來解析,因爲咱們使用的是字符串,直接用
FileReader
來讀便可bash
/**
* 做者:張風捷特烈 時間:2019-10-24 郵箱:1981462002@qq.com
* 說明:字符解析測試類
*/
public class Parser {
public static void main(String[] args) {
String dir = System.getProperty("user.dir");
File file = new File(dir,"regex/src/main/resources/regx/book.txt");
System.out.println(readFile(file));
}
//讀取字符文件
private static String readFile(File file) {
StringBuilder sb= new StringBuilder();
try(FileReader fr= new FileReader(file) ){
char[] buff = new char[1024];
int len = 0;
while ((len = fr.read(buff)) != -1) {
sb.append(new String(buff, 0, len));
}
} catch ( IOException |RuntimeException e) {
e.printStackTrace();
}
return sb.toString();
}
}
複製代碼
上面的黃色匹配部位均可以經過代碼獲取。Java經過
Pattern
和Matcher
兩類完成
下面這樣就能夠很輕鬆地獲取文件中全部的書名,不管幾十萬行,幾百萬行,通行無阻微信
private static void regexBook(String target) {
String regex="《.*?》";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(target);
while (matcher.find()){
System.out.println(matcher.group());
}
}
複製代碼
藏扇仙:如今定義一個語法模板
${}
,要求提取全部符合要求的信息app
捷特:這還不簡單,看我-控鶴擒龍post
private static void regexWidget(String target) {
String regex="\\$\\{.*?}";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(target);
while (matcher.find()){
System.out.println(matcher.group());
}
}
複製代碼
藏扇仙:據說你掘金有很多關注者,分析一下頁面,獲取他們的名字
捷特:這有點意思,最重要的仍是分析結構進行夾逼。(這懶加載滑得好累,滑出4000多個,夠用了)測試
private static void regexHtml(String target) {
String regex="username\">.*?<";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(target);
while (matcher.find()){
System.out.println(matcher.group());
}
}
複製代碼
藏扇仙:這招控鶴擒龍,你可要多加練習,在提取信息時是很是有用的。
捷特:我也感到了,很是好用,特別是像網頁這樣規則固定的字符串。下一招呢?
藏扇仙:你先練着,爲師歇會。下一招,正則十八式-第三式:龍躍於淵。
複製代碼
1----本文由張風捷特烈原創,轉載請註明
2----若是有什麼想要交流的,歡迎留言。也能夠加微信:zdl1994328
3----我的能力有限,若有不正之處歡迎你們批評指證,一定虛心改正
4----看到這裏,我在此感謝你的喜歡與支持,掃碼關注-編程之王ui