go語言之進階篇正則表達式

時間 2019-11-30

原文原文鏈接

正則表達式是一種進行模式匹配和文本操縱的複雜而又強大的工具。雖然正則表達式比純粹的文本匹配效率低，可是它卻更靈活。按照它的語法規則，隨需構造出的匹配模式就可以從原始文本中篩選出幾乎任何你想要獲得的字符組合。html

Go語言經過regexp標準包爲正則表達式提供了官方支持，若是你已經使用過其餘編程語言提供的正則相關功能，那麼你應該對Go語言版本的不會太陌生，可是它們之間也有一些小的差別，由於Go實現的是RE2標準，除了\C，詳細的語法描述參考：http://code.google.com/p/re2/wiki/Syntaxgolang

其實字符串處理咱們能夠使用strings包來進行搜索(Contains、Index)、替換(Replace)和解析(Split、Join)等操做，可是這些都是簡單的字符串操做，他們的搜索都是大小寫敏感，並且固定的字符串，若是咱們須要匹配可變的那種就沒辦法實現了，固然若是strings包能解決你的問題，那麼就儘可能使用它來解決。由於他們足夠簡單、並且性能和可讀性都會比正則好。正則表達式

1、正則匹配規則圖chrome

參考官網： https://studygolang.com/pkgdoc編程

2、正則表達式app

示例1: . 匹配任意類型編程語言

package main

import (
	"fmt"
	"regexp"
)

func main() {

	buf := "abc azc a7c aac 888 a9c  tac"

	//1) 解釋規則, 它會解析正則表達式，若是成功返回解釋器
	reg1 := regexp.MustCompile(`a.c`)
	if reg1 == nil {
		fmt.Println("regexp err")
		return
	}

	//2) 根據規則提取關鍵信息
	result1 := reg1.FindAllStringSubmatch(buf, -1)
	fmt.Println("result1 = ", result1)
}

#執行結果：工具

result1 =  [[abc] [azc] [a7c] [aac] [a9c]]

二、匹配a[0-9]c之間的數值性能

示例2：學習

package main

import (
	"fmt"
	"regexp"
)

func main() {

	buf := "abc azc a7c aac 888 a9c  tac"

	//1) 解釋規則, 它會解析正則表達式，若是成功返回解釋器
	reg1 := regexp.MustCompile(`a[0-9]c`)

	if reg1 == nil { //解釋失敗，返回nil
		fmt.Println("regexp err")
		return
	}

	//2) 根據規則提取關鍵信息
	result1 := reg1.FindAllStringSubmatch(buf, -1)
	fmt.Println("result1 = ", result1)

}

執行結果：

result1 =  [[a7c] [a9c]]

三、\d 匹配a[0-9]c之間的數值

示例3：

package main

import (
	"fmt"
	"regexp"
)

func main() {

	buf := "abc azc a7c aac 888 a9c  tac"

	//1) 解釋規則, 它會解析正則表達式，若是成功返回解釋器
	reg1 := regexp.MustCompile(`a\dc`)
	if reg1 == nil { //解釋失敗，返回nil
		fmt.Println("regexp err")
		return
	}

	//2) 根據規則提取關鍵信息
	result1 := reg1.FindAllStringSubmatch(buf, -1)
	fmt.Println("result1 = ", result1)

}

執行結果：

result1 =  [[a7c] [a9c]]

四、 +匹配前一個字符的1次或屢次

示例：

package main

import (
	"fmt"
	"regexp"
)

func main() {
	buf := "43.14 567 agsdg 1.23 7. 8.9 1sdljgl 6.66 7.8   "

	//解釋正則表達式, +匹配前一個字符的1次或屢次
	reg := regexp.MustCompile(`\d+\.\d+`)
	if reg == nil {
		fmt.Println("MustCompile err")
		return
	}

	//提取關鍵信息
	//result := reg.FindAllString(buf, -1)
	result := reg.FindAllStringSubmatch(buf, -1)
	fmt.Println("result = ", result)

}

執行結果：

result =  [[43.14] [1.23] [8.9] [6.66] [7.8]]

五、過濾帶標籤或不帶標籤的

package main

import (
	"fmt"
	"regexp"
)

func main() {
	//``   原生字符串
	buf := `
	
<!DOCTYPE html>
<html lang="zh-CN">
<head>
	<title>Go語言標準庫文檔中文版 | Go語言中文網 | Golang中文社區 | Golang中國</title>
	<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
	<meta http-equiv="X-UA-Compatible" content="IE=edge, chrome=1">
	<meta charset="utf-8">
	<link rel="shortcut icon" href="/static/img/go.ico">
	<link rel="apple-touch-icon" type="image/png" href="/static/img/logo2.png">
	<meta name="author" content="polaris <polaris@studygolang.com>">
	<meta name="keywords" content="中文, 文檔, 標準庫, Go語言,Golang,Go社區,Go中文社區,Golang中文社區,Go語言社區,Go語言學習,學習Go語言,Go語言學習園地,Golang 中國,Golang中國,Golang China, Go語言論壇, Go語言中文網">
	<meta name="description" content="Go語言文檔中文版，Go語言中文網，中國 Golang 社區，Go語言學習園地，致力於構建完善的 Golang 中文社區，Go語言愛好者的學習家園。分享 Go 語言知識，交流使用經驗">
</head>
	<div>和愛好</div>
	<div>哈哈
	你在嗎
	不在
	</div>
	<div>測試</div>
	<div>你過來啊</div>

<frameset cols="15,85">
	<frame src="/static/pkgdoc/i.html">
	<frame name="main" src="/static/pkgdoc/main.html" tppabs="main.html" >
	<noframes>
	</noframes>
</frameset>
</html>
	`

	//解釋正則表達式, +匹配前一個字符的1次或屢次
	//reg := regexp.MustCompile(`<div>(.*)</div>`)
	reg := regexp.MustCompile(`<div>(?s:(.*?))</div>`)
	if reg == nil {
		fmt.Println("MustCompile err")
		return
	}

	//提取關鍵信息
	result := reg.FindAllStringSubmatch(buf, -1)
	//fmt.Println("result = ", result)

	//過濾<></>
	for _, text := range result {
		//過濾帶標籤的
		//fmt.Println("text[0] = ", text[0]) //帶<></>
		//過濾不帶標籤的
		fmt.Println("text[1] = ", text[1]) //不帶<></>
	}
}

#執行結果：

過濾帶標籤的

text[0] =  <div>和愛好</div>
text[0] =  <div>哈哈
	你在嗎
	不在
	</div>
text[0] =  <div>測試</div>
text[0] =  <div>你過來啊</div>

//過濾不帶標籤的text[1] =  和愛好
text[1] =  哈哈
	你在嗎
	不在
	
text[1] =  測試
text[1] =  你過來啊

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。