python正則表達式re.search()怎么使用？

猿友 2021-07-22 11:43:42 瀏覽數 (18937)

反饋

正則表達式是一種字符串匹配方法，它可以用來匹配字符串。很多語言都有正則表達式的應用，比如python應用正則表達式的地方最出名的就是爬蟲中一些字段的匹配。python的正則表達式的實現(xiàn)由一個名叫re的模塊實現(xiàn)，該模塊下有個叫re.search()的方法，今天我們就來介紹這個方法。

1 re.search() 的作用:

re.search會匹配整個字符串，并返回第一個成功的匹配。如果匹配失敗，則返回None

從源碼里面可以看到re.search()方法里面有3個參數

search方法介紹

pattern: 匹配的規(guī)則,

string : 要匹配的內容,

flags 標志位這個是可選的,就是可以不寫,可以寫, 比如要忽略字符的大小寫就可以使用標志位

flags 的主要內容如下

flags : 可選，表示匹配模式，比如忽略大小寫，多行模式等，具體參數為：

re.I 忽略大小寫
re.L 表示特殊字符集 w, W, , B, s, S 依賴于當前環(huán)境
re.M 多行模式
re.S 即為 . 并且包括換行符在內的任意字符（. 不包括換行符）
re.U 表示特殊字符集 w, W, , B, d, D, s, S 依賴于 Unicode 字符屬性數據庫
re.X 為了增加可讀性，忽略空格和 # 后面的注釋

2 demo 練習re.search() 的使用

2.1 search 簡單的匹配

import re
 
content = "abcabcabc"
rex = re.search("c", content)
print(rex)

打印結果如下

運行結果

從內容我們可以看到span(2, 3) 這個應該是對應的下標,所以我們想獲取匹配的下標可以使用span

match 是匹配的內容, 內容為c

2.2 獲取匹配的下標

import re
 
content = "abcabcabc"
rex = re.search("c", content)
print(rex.group())

打印結果如下

運行結果

2.3 獲取匹配的內容 ,使用group(匹配的整個表達式的字符串)

import re
 
content = "abcabcabc"
rex = re.search("c", content)
print(rex.group())

打印結果如下

注意group 和span 不能同時使用, 否則會報錯

2.4 使用標志位忽略匹配的大小寫

import re
 
content = "abcabcabc"
rex = re.search("C", content, re.I)
print(rex.group())

打印結果如下

運行結果

這里使用大寫字母C 忽略大小寫之后也能匹配到c

2.5 使用search 匹配字符串里面的數組

import re
 
content = "abc123abc"
rex = re.search("d+", content)
print(rex.group())

打印結果

運行結果

2.6 search 結合compile 使用

import re
 
content = "abc123abc"
rex_content = re.compile("d+")
rex = rex_content.search(content)
print(rex.group())

打印結果

運行結果

2.7 group 的使用

import re
 
content = "abc123def"
rex_compile = re.compile("([a-z]*)([0-9]*)([a-z]*)")
rex = rex_compile.search(content)
print(rex.group())
print(rex.group(0))  # group()和group(0) 一樣匹配的是整體
print(rex.group(1))  # 匹配第一個小括號的內容
print(rex.group(2))  # 匹配第二個小括號的內容
print(rex.group(3))  # 匹配第三個小括號的內容

打印結果

運行結果

group() 小括號里面不止有數字,可以是自定的內容如下

content = "zhangsanfeng108le"
rex_compile = re.compile("(?P<name>[a-z]*)(?P<age>[0-9]*)")
rex_content = rex_compile.search(content)
print(rex_content.group())
print(rex_content.group("name"))  # 這里效果等同于group(1)
print(rex_content.group("age"))  # 這里效果等同于group(2)

打印結果如下

運行結果

總結

到此這篇python應用正則表達式的文章就介紹到這了,更多python相關的學習內容請搜索W3Cschool以前的文章或繼續(xù)瀏覽下面的相關文章。

Python

0 人點贊