W3Cschool
恭喜您成為首批注冊(cè)用戶(hù)
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
你正在試著使用正則表達(dá)式去匹配一大塊的文本,而你需要跨越多行去匹配。
這個(gè)問(wèn)題很典型的出現(xiàn)在當(dāng)你用點(diǎn)(.)去匹配任意字符的時(shí)候,忘記了點(diǎn)(.)不能匹配換行符的事實(shí)。比如,假設(shè)你想試著去匹配C語(yǔ)言分割的注釋?zhuān)?/p>
>>> comment = re.compile(r'/\*(.*?)\*/')
>>> text1 = '/* this is a comment */'
>>> text2 = '''/* this is a
... multiline comment */
... '''
>>>
>>> comment.findall(text1)
[' this is a comment ']
>>> comment.findall(text2)
[]
>>>
為了修正這個(gè)問(wèn)題,你可以修改模式字符串,增加對(duì)換行的支持。比如:
>>> comment = re.compile(r'/\*((?:.|\n)*?)\*/')
>>> comment.findall(text2)
[' this is a\n multiline comment ']
>>>
在這個(gè)模式中,(?:.|\n)
指定了一個(gè)非捕獲組(也就是它定義了一個(gè)僅僅用來(lái)做匹配,而不能通過(guò)單獨(dú)捕獲或者編號(hào)的組)。
re.compile()
函數(shù)接受一個(gè)標(biāo)志參數(shù)叫 re.DOTALL
,在這里非常有用。它可以讓正則表達(dá)式中的.匹配包括換行符在內(nèi)的任意字符。比如:
>>> comment = re.compile(r'/\*(.*?)\*/', re.DOTALL)
>>> comment.findall(text2)
[' this is a\n multiline comment ']
對(duì)于簡(jiǎn)單的情況使用 re.DOTALL
標(biāo)記參數(shù)工作的很好,但是如果模式非常復(fù)雜或者是為了構(gòu)造字符串令牌而將多個(gè)模式合并起來(lái)(2.18節(jié)有詳細(xì)描述),這時(shí)候使用這個(gè)標(biāo)記參數(shù)就可能出現(xiàn)一些問(wèn)題。如果讓你選擇的話,最好還是定義自己的正則表達(dá)式模式,這樣它可以在不需要額外的標(biāo)記參數(shù)下也能工作的很好。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: