如何在Go語言中使用正則表達(dá)式

本篇文章給大家分享的是有關(guān)如何在Go語言中使用正則表達(dá)式,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

公司主營業(yè)務(wù):網(wǎng)站建設(shè)、成都網(wǎng)站建設(shè)、移動(dòng)網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。創(chuàng)新互聯(lián)建站是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會用頭腦與智慧不斷的給客戶帶來驚喜。創(chuàng)新互聯(lián)建站推出蘭坪免費(fèi)做網(wǎng)站回饋大家。

正則表達(dá)式是一種進(jìn)行模式匹配和文本操縱的功能強(qiáng)大的工具。正則表達(dá)式靈活、易用,按照它的語法規(guī)則,隨需構(gòu)造出的匹配模式就能夠從原始文本中篩選出幾乎任何你想要得到的字符組合。

準(zhǔn)則

  • 默認(rèn)是最短匹配,只要字符串滿足條件就返回。

  • 如果沒有匹配到,都是返回為nil。

  • 如果需要做最長匹配,調(diào)用Longest()函數(shù)。

  • 正則表達(dá)式功能:匹配(macth),查找(find)和替換(replace)。

  • 存在長度選擇的函數(shù),傳入<0的數(shù)字表示匹配全部。

使用regexp調(diào)用

Match,MatchReader和 MatchString

// 判斷b中是夠包含pattern能夠組成的任意字符串
func Match(pattern string, b []byte) (matched bool, err error)

// 判斷reader r中返回的字符串是否包含pattern能夠組成的任意字符串
func MatchReader(pattern string, r io.RuneReader) (matched bool, err error)

// 判斷字符串s中是否包含pattern能夠組成的任意字符串
func MatchString(pattern string, s string) (matched bool, err error)

Compile 和 MushCompile

func Compile(expr string) (*Regexp, error)
func MustCompile(str string) *Regexp

Compile :返回 Regexp 對象,方便調(diào)用指針函數(shù)。

MustCompile :同Compile,解析表達(dá)式失敗,會panic。

在匹配文本時(shí),該正則表達(dá)式會盡可能早的開始匹配,并且在匹配過程中選擇回溯搜索到的第一個(gè)匹配結(jié)果。這種模式被稱為 leftmost-first ,另外一般情況下使用 MustCompile 即可。

使用regexp.Regexp對象來調(diào)用

Find 和 FindAll

  • func (re *Regexp) Find(b []byte) []byte

  • func (re *Regexp) FindAll(b []byte, n int) [][]byte

Find返回保管正則表達(dá)式re在b中的最左側(cè)的一個(gè)匹配結(jié)果的[]byte切片。如果沒有匹配到,會返回nil,最多匹配一個(gè)。

re := regexp.MustCompile(`foo.?`)
fmt.Printf("%q\n", re.Find([]byte(`seafood fool`)))
re := regexp.MustCompile(`foo.?`)
fmt.Printf("%q\n", re.FindAll([]byte(`seafood fool`), -1))

FindAll 功能與 Find 一樣,只是返回全部滿足條件的數(shù)據(jù)。

FindString 和 FindAllString

  • func (re *Regexp) FindString(s string) string

  • func (re *Regexp) FindAllString(s string, n int) []string

與 Find 和 FindAll 一樣,只是針對字符串string操作。

FindIndex 和 FindAllIndex

  • func (re *Regexp) FindIndex(b []byte) (loc []int)

  • func (re *Regexp) FindAllIndex(b []byte, n int) [][]int

FindIndex , 返回 b 中滿足匹配字符串部分的起始位置,同樣是**“l(fā)eftmost-first”**原則,loc包含起止位置。如果沒有找到,直接返回 nil 。

FindAllIndex ,功能和 FindIndex 保持一致,只是匹配多個(gè), n 決定了匹配的位置。

FindStringIndex 和 FindAllStringIndex

  • func (re *Regexp) FindStringIndex(s string) (loc []int)

  • func (re *Regexp) FindAllStringIndex(s string, n int) [][]int

與 FindIndex 和 FindAllIndex 使用方式類似,只是針對的是字符串string。

FindStringSubmatch 和 FindAllStringSubmatch

  • func (re *Regexp) FindStringSubmatch(s string) []string

FindStringSubmatch :采用左匹配原則,最多匹配一個(gè),如果沒有的話,返回 nil 。對于返回的 []string ,分別標(biāo)示匹配的字符串,子串。

re := regexp.MustCompile(`a(x*)b(y|z)c`)
fmt.Printf("%q\n", re.FindStringSubmatch("-axxxbyc-"))
fmt.Printf("%q\n", re.FindStringSubmatch("-abzc-"))

輸出結(jié)果:

["axxxbyc" "xxx" "y"]
["abzc" "" "z"]

  • func (re *Regexp) FindAllStringSubmatch(s string, n int) [][]string

和 FindStringSubmatch 使用類似,只是能顧選擇匹配的長度, -1 表示匹配到末尾。

re := regexp.MustCompile(`a(x*)b`)
fmt.Printf("%q\n", re.FindAllStringSubmatch("-ab-", -1))
fmt.Printf("%q\n", re.FindAllStringSubmatch("-axxb-", -1))
fmt.Printf("%q\n", re.FindAllStringSubmatch("-ab-axb-", -1))
fmt.Printf("%q\n", re.FindAllStringSubmatch("-axxb-ab-", -1))

輸出結(jié)果:

[["ab" ""]]
[["axxb" "xx"]]
[["ab" ""] ["axb" "x"]]
[["axxb" "xx"] ["ab" ""]]

FindSubmatchIndex 和 FindAllSubmatchIndex

  • func (re *Regexp) FindSubmatchIndex(b []byte) []int

  • func (re *Regexp) FindAllSubmatchIndex(b []byte, n int) [][]int 計(jì)算子串在源串中的位置,已經(jīng)存在 (x*) 等返回結(jié)果處理,如果沒有返回 nil 。

另外, index 返回為 左閉右開 的模式,示例中的 2,2 表示空字符串的意思。 并且,不會存在重合匹配的,比如說"-axxb-ab-"去匹配 a(x*)b ,不會存在第一個(gè) a 和最后一個(gè) b 結(jié)合的情況,如果使用 Longest 就會匹配最長的。

re := regexp.MustCompile(`a(x*)b`)
// Indices:
// 01234567 012345678
// -ab-axb- -axxb-ab-
fmt.Println(re.FindAllStringSubmatchIndex("-ab-", -1))
fmt.Println(re.FindAllStringSubmatchIndex("-axxb-", -1))
fmt.Println(re.FindAllStringSubmatchIndex("-ab-axb-", -1))
fmt.Println(re.FindAllStringSubmatchIndex("-axxb-ab-", -1))
fmt.Println(re.FindAllStringSubmatchIndex("-foo-", -1))

輸出結(jié)果:

[[1 3 2 2]] // 2 2 表示為空
[[1 5 2 4]]
[[1 3 2 2] [4 7 5 6]]
[[1 5 2 4] [6 8 7 7]]
[]


FindStringSubmatchIndex 和 FindAllStringSubmatchIndex
func (re *Regexp) FindStringSubmatchIndex(s string) []int
func (re *Regexp) FindAllStringSubmatchIndex(s string, n int) [][]int
和 FindSubmatchIndex , FindAllSubmatchIndex 保持一致。

Longest
func (re *Regexp) Longest() 獲取最長匹配的滿足條件的內(nèi)容。
re := regexp.MustCompile(`a(|b)`)
fmt.Println(re.FindString("ab"))
re.Longest()
fmt.Println(re.FindString("ab"))

輸出結(jié)果:

a
ab

下面這種情況不會最長匹配。

re := regexp.MustCompile(`a(x*)b`)
re.Longest()
fmt.Println(re.FindString("-axxb-ab-")) // axxb,不會存在第一個(gè)a和最后一個(gè)b組合的過程。

Match,MatchString和MatchReader

  • func (re *Regexp) Match(b []byte) bool

  • func (re *Regexp) MatchString(s string) bool

  • func (re *Regexp) MatchReader(r io.RuneReader) bool

判斷 b , s 和 r 返回的數(shù)據(jù)是否滿足正則表達(dá)式,返回 true 或者 false 。

NumSubexp

  • func (re *Regexp) NumSubexp() int

返回分組的數(shù)量。

re0 := regexp.MustCompile(`a.`)
fmt.Printf("%d\n", re0.NumSubexp())

re := regexp.MustCompile(`(.*)((a)b)(.*)a`)
fmt.Println(re.NumSubexp())

輸出結(jié)果:

0
4

ReplaceAll 和 ReplaceAllString
func (re *Regexp) ReplaceAll(src, repl []byte) []byte
func (re *Regexp) ReplaceAllString(src, repl string) string
ReplaceAllString 與 ReplaceAll 使用方式相同。

re := regexp.MustCompile(`a(x*)b`)
fmt.Printf("%s\n", re.ReplaceAll([]byte("-ab-axxb-"), []byte("T"))) 
fmt.Printf("%s\n", re.ReplaceAll([]byte("-ab-axxb-"), []byte("$1"))) // $1表示匹配的第一個(gè)子串,這是ab的中間無字符串,所以$1為空,然后使用空去替換滿足正則表達(dá)式的部分。
fmt.Printf("%s\n", re.ReplaceAll([]byte("-ab-axxb-"), []byte("$1W"))) // "$1W"等價(jià)與"$(1W)",值為空,將滿足條件的部分完全替換為空。
fmt.Printf("%s\n", re.ReplaceAll([]byte("-ab-axxb-"), []byte("${1}W"))) // ${1}匹配(x*),保留。輸出-W-xxW-

輸出結(jié)果:

-T-T-
--xx-
---
-W-xxW-

s := "Hello World, 123 Go!"
//定義一個(gè)正則表達(dá)式reg,匹配Hello或者Go
reg := regexp.MustCompile(`(Hell|G)o`)

s2 := "2019-12-01,test"
//定義一個(gè)正則表達(dá)式reg2,匹配 YYYY-MM-DD 的日期格式
reg2 := regexp.MustCompile(`(\d{4})-(\d{2})-(\d{2})`)

//最簡單的情況,用“T替換”"-ab-axxb-"中符合正則"a(x*)b"的部分
reg3 := regexp.MustCompile("a(x*)b")
fmt.Println(re.ReplaceAllString("-ab-axxb-", "T")) // -T-T-

//${1}匹配"Hello World, 123 Go!"中符合正則`(Hell|G)`的部分并保留,去掉"Hello"與"Go"中的'o'并用"ddd"追加
rep1 := "${1}ddd"
fmt.Printf("%q\n", reg.ReplaceAllString(s, rep1)) // Hellddd World, 123 Gddd!

//首先,"2019-12-01,test"中符合正則表達(dá)式`(\d{4})-(\d{2})-(\d{2})`的部分是"2019-12-01",將該部分匹配'(\d{4})'的'2019'保留,去掉剩余部分
rep2 := "${1}"
fmt.Printf("%q\n", reg2.ReplaceAllString(s2,rep2)) // 2019,test

//首先,"2019-12-01,test"中符合正則表達(dá)式`(\d{4})-(\d{2})-(\d{2})`的部分是"2019-12-01",將該部分匹配'(\d{2})'的'12'保留,去掉剩余部分
 rep3 := "${2}"
fmt.Printf("%q\n", reg2.ReplaceAllString(s2,rep3)) // 12,test

//首先,"2019-12-01,test"中符合正則表達(dá)式`(\d{4})-(\d{2})-(\d{2})`的部分是"2019-12-01",將該部分匹配'(\d{2})'的'01'保留,去掉剩余部分,并追加"13:30:12"
rep4 := "${3}:13:30:12"
fmt.Printf("%q\n", reg2.ReplaceAllString(s2,rep4)) // 01:13:30:12,test
}

ReplaceAllFunc 和 ReplaceAllStringFunc

  • func (re *Regexp) ReplaceAllFunc(src []byte, repl func([]byte) []byte) []byte

  • func (re *Regexp) ReplaceAllStringFunc(src string, repl func(string) string) string

將匹配出來滿足條件的 []byte 作為參數(shù)傳入函數(shù)中。

re := regexp.MustCompile(`[^aeiou]`)
fmt.Println(re.ReplaceAllStringFunc("seafood fool", strings.ToUpper))

兩者使用方式類似。

ReplaceAllLiteral 和 ReplaceAllLiteralString

  • func (re *Regexp) ReplaceAllLiteral(src, repl []byte) []byte

  • func (re *Regexp) ReplaceAllLiteralString(src, repl string) string

匹配字面常量,不轉(zhuǎn)換。

re := regexp.MustCompile(`a(x*)b`)
fmt.Println(re.ReplaceAllLiteralString("-ab-axxb-", "T"))
fmt.Println(re.ReplaceAllLiteralString("-ab-axxb-", "$1"))
fmt.Println(re.ReplaceAllLiteralString("-ab-axxb-", "${1}"))

輸出結(jié)果:

-T-T-
-$1-$1-
-${1}-${1}-

關(guān)于 $1 說明:

如何在Go語言中使用正則表達(dá)式

如何在Go語言中使用正則表達(dá)式

Expand 和 ExpandString

  • func (re *Regexp) Expand(dst []byte, template []byte, src []byte, match []int) []byte

  • func (re *Regexp) ExpandString(dst []byte, template string, src string, match []int) []byte

Expand返回新生成的將template添加到dst后面的切片。在添加時(shí),Expand會將template中的變量替換為從src匹配的結(jié)果。match應(yīng)該是被FindSubmatchIndex返回的匹配結(jié)果起止位置索引。(通常就是匹配src,除非你要將匹配得到的位置用于另一個(gè)[]byte)

在template參數(shù)里,一個(gè)變量表示為格式如: $name 或 ${name} 的字符串,其中name是長度>0的字母、數(shù)字和下劃線的序列。一個(gè)單純的數(shù)字字符名如$1會作為捕獲分組的數(shù)字索引;其他的名字對應(yīng)(?P...)語法產(chǎn)生的命名捕獲分組的名字。超出范圍的數(shù)字索引、索引對應(yīng)的分組未匹配到文本、正則表達(dá)式中未出現(xiàn)的分組名,都會被替換為空切片。

$name格式的變量名,name會盡可能取最長序列: $1x 等價(jià)于 ${1x} 而非 ${1}x , $10 等價(jià)于 ${10} 而非 ${1}0 。因此 $name 適用在后跟空格/換行等字符的情況, ${name} 適用所有情況。

如果要在輸出中插入一個(gè)字面值 '$' ,在template里可以使用 $$ 。

其他示例

解析網(wǎng)址

flysnowRegexp := regexp.MustCompile(`^http://www.flysnow.org/([\d]{4})/([\d]{2})/([\d]{2})/([\w-]+).html$`)
params := flysnowRegexp.FindStringSubmatch("http://www.flysnow.org/2018/01/20/golang-goquery-examples-selector.html")
// 返回[]string{}數(shù)據(jù)類型
for _, param := range params {
 fmt.Println(param)
}

輸出結(jié)果:

http://www.flysnow.org/2018/01/20/golang-goquery-examples-selector.html
2018
01
20
golang-goquery-examples-selector

以上就是如何在Go語言中使用正則表達(dá)式,小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

當(dāng)前標(biāo)題:如何在Go語言中使用正則表達(dá)式
當(dāng)前URL:http://muchs.cn/article28/ighdjp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供全網(wǎng)營銷推廣網(wǎng)站建設(shè)、網(wǎng)站維護(hù)、品牌網(wǎng)站建設(shè)、域名注冊自適應(yīng)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作