W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
你想在字符串中搜索和匹配指定的文本模式
對于簡單的字面模式,直接使用 str.repalce()
方法即可,比如:
>>> text = 'yeah, but no, but yeah, but no, but yeah'
>>> text.replace('yeah', 'yep')
'yep, but no, but yep, but no, but yep'
>>>
對于復雜的模式,請使用re模塊中的 sub()
函數(shù)。為了說明這個,假設你想將形式為”11/27/201”的日期字符串改成”2012-11-27”。示例如下:
>>> text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
>>> import re
>>> re.sub(r'(\d+)/(\d+)/(\d+)', r'\3-\1-\2', text)
'Today is 2012-11-27. PyCon starts 2013-3-13.'
>>>
sub()
函數(shù)中的第一個參數(shù)是被匹配的模式,第二個參數(shù)是替換模式。反斜杠數(shù)字比如3指向前面模式的捕獲組號。
如果你打算用相同的模式做多次替換,考慮先編譯它來提升性能。比如:
>>> import re
>>> datepat = re.compile(r'(\d+)/(\d+)/(\d+)')
>>> datepat.sub(r'\3-\1-\2', text)
'Today is 2012-11-27. PyCon starts 2013-3-13.'
>>>
對于更加復雜的替換,可以傳遞一個替換回調函數(shù)來代替,比如:
>>> from calendar import month_abbr
>>> def change_date(m):
... mon_name = month_abbr[int(m.group(1))]
... return '{} {} {}'.format(m.group(2), mon_name, m.group(3))
...
>>> datepat.sub(change_date, text)
'Today is 27 Nov 2012. PyCon starts 13 Mar 2013.'
>>>
一個替換回調函數(shù)的參數(shù)是一個 match
對象,也就是 match()
或者 find()
返回的對象。使用 group()
方法來提取特定的匹配部分。回調函數(shù)最后返回替換字符串。
如果除了替換后的結果外,你還想知道有多少替換發(fā)生了,可以使用 re.subn()
來代替。比如:
>>> newtext, n = datepat.subn(r'\3-\1-\2', text)
>>> newtext
'Today is 2012-11-27. PyCon starts 2013-3-13.'
>>> n
2
>>>
關于正則表達式搜索和替換,上面演示的 sub()
方法基本已經(jīng)涵蓋了所有。其實最難的部分就是編寫正則表達式模式,這個最好是留給作者自己去練習了。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: