字符串(string,簡寫為str)是 Python 中最常用的數(shù)據(jù)類型之一。我們可以使用引號( ' 或 " )來創(chuàng)建字符串。
創(chuàng)建字符串很簡單,只要為變量分配一個值即可。例如:
var1 = 'Hello World!'
var2 = "W3Cschool"
Python 不支持單字符類型,單字符在 Python 中也是作為一個字符串使用。
Python 訪問子字符串,可以使用方括號 ?[]
?來截取字符串(這種方式也被稱為切片),字符串的截取的語法格式如下:
變量[頭下標(biāo):尾下標(biāo)]
python截取的特點(diǎn)是取頭下標(biāo)的值到尾下標(biāo)的值(尾下標(biāo)的值不取)
索引值以 0 為開始值,-1 為從末尾的開始位置。
從后面索引 | -9 | -8 | -7 | -6 | -5 | -4 | -3 | -2 | -1 | |||||||||||
從前面索引 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |||||||||||
W | 3 | C | s | c | h | o | o | l | ||||||||||||
從前面截取 | : | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | : | ||||||||||
從后面截取 | : |
|
-8 | -7 | -6 | -5 | -4 | -3 | -2 | -1 | : |
以下代碼都是取字符C:
str="W3cschool"
print(str[2:3]) #使用截取方式,用正序進(jìn)行截取
print(str[2:-6])#使用截取方式,正序和倒序混合使用
print(str[-7:-6])#使用截取方式,使用倒序進(jìn)行截取
print(str[-7])#使用負(fù)索引獲取單個字符C
print(str[2])#使用正索引獲取單個字符C
切片的更多案例:
str="W3cschool"
#取W3C
print(str[:3])
print(str[:-6])
#取sch
print(str[3:6])
print(str[-6:-3])
#只有頭下標(biāo)/尾下標(biāo)的情況
print(str[:3])
#只有尾下標(biāo)的情況,默認(rèn)頭下標(biāo)為0(正序的0,也就是字符串開始的地方)
#也就是從字符串開頭截取到3的位置(也就是W3C)
print(str[3:])
#只有頭下標(biāo)的情況,默認(rèn)尾下標(biāo)為0(逆序的0,也就是字符串結(jié)束的地方)
#也就是從3的位置截取到字符串結(jié)尾(也就是school)
#更多應(yīng)用
str2 ="http://www.o2fo.com/"
#截取協(xié)議名稱
print(str2[:5]) #也就是截取前五位
#截取域名
print(str2[8:-1]) #也就是截取第八位到倒數(shù)第一位
有一些字符因?yàn)樵趐ython中已經(jīng)被定義為一些操作(比如單引號和雙引號被用來引用字符串),而這些符號我們可能在字符串中需要使用到。為了能夠使用這些特殊字符,可以用反斜杠 \ 轉(zhuǎn)義字符(同樣地,反斜杠也可以用來轉(zhuǎn)義反斜杠)。如下表:
轉(zhuǎn)義字符 | 描述 | 實(shí)例 |
---|---|---|
\(在行尾時) | 續(xù)行符 |
|
\\ | 反斜杠符號 |
|
\' | 單引號 |
|
\" | 雙引號 |
|
\a | 響鈴 | 執(zhí)行后電腦有響聲。 |
\b | 退格(Backspace) |
|
\000 | 空 |
|
\n | 換行 |
|
\v | 縱向制表符 |
|
\t | 橫向制表符 |
|
\r | 回車,將 \r 后面的內(nèi)容移到字符串開頭,并逐一替換開頭部分的字符,直至將 \r 后面的內(nèi)容完全替換完成。 |
|
\f | 換頁 |
|
\yyy | 八進(jìn)制數(shù),y 代表 0~7 的字符,例如:\012 代表換行。 |
|
\xyy | 十六進(jìn)制數(shù),以 \x 開頭,y 代表的字符,例如:\x0a 代表換行 |
|
\other | 其它的字符以普通格式輸出 |
下表實(shí)例變量 a 值為字符串 "Hello",b 變量值為 "W3Cschool":
操作符 | 描述 | 實(shí)例 |
---|---|---|
+ | 字符串連接 | a + b 輸出結(jié)果: HelloW3Cschool
|
* | 重復(fù)輸出字符串 | a*2 輸出結(jié)果:HelloHello
|
[] | 通過索引獲取字符串中字符 | a[1] 輸出結(jié)果 e
|
[ : ] | 截取字符串中的一部分(切片),遵循左閉右開原則,str[0:2] 是不包含第 3 個字符的(詳見上上節(jié)內(nèi)容)。 | a[1:4] 輸出結(jié)果 ell
|
in | 成員運(yùn)算符 - 如果字符串中包含給定的字符返回 True | 'H' in a 輸出結(jié)果 ?True ?
|
not in | 成員運(yùn)算符 - 如果字符串中不包含給定的字符返回 True | 'M' not in a 輸出結(jié)果 ?True ?
|
r/R | 原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思來使用,沒有轉(zhuǎn)義特殊或不能打印的字符。 原始字符串除在字符串的第一個引號前加上字母 r(不區(qū)分大小寫)以外,與普通字符串有著幾乎完全相同的語法。 |
|
% | 格式字符串 | 請看下一節(jié)內(nèi)容。 |
Python 支持格式化字符串的輸出 。盡管這樣可能會用到非常復(fù)雜的表達(dá)式,但最基本的用法是將一個值插入到一個有字符串格式符 ?%s
? 的字符串中。
在 Python 中,字符串的格式化使用與 C/C++中的printf函數(shù)有著一樣的語法。
例如
#!/usr/bin/python3
name = "小明"
age = 10
print ("我叫 %s 今年 %d 歲!" % (name, age))
以上實(shí)例輸出結(jié)果:
我叫 小明 今年 10 歲!
python字符串格式化符號:
符 號 | 描述 |
---|---|
?%c ? |
格式化字符及其ASCII碼 |
? %s ? |
格式化字符串 |
? %d ? |
格式化整型 |
?%u ? |
格式化無符號整型 |
? %o ? |
格式化無符號八進(jìn)制數(shù) |
?%x ? |
格式化無符號十六進(jìn)制數(shù) |
?%X ? |
格式化無符號十六進(jìn)制數(shù)(大寫) |
? %f ? |
格式化浮點(diǎn)數(shù)字,可指定小數(shù)點(diǎn)后的精度 |
? %e ? |
用科學(xué)計(jì)數(shù)法格式化浮點(diǎn)數(shù) |
?%E ? |
作用同?%e ?,用科學(xué)計(jì)數(shù)法格式化浮點(diǎn)數(shù) |
?%g ? |
?%f ?和?%e ?的簡寫 |
?%G ? |
?%f ?和? %E ? 的簡寫 |
?%p ? |
用十六進(jìn)制數(shù)格式化變量的地址 |
格式化操作符輔助指令:
符號 | 功能 |
---|---|
* | 定義寬度或者小數(shù)點(diǎn)精度 |
- | 用做左對齊 |
+ | 在正數(shù)前面顯示加號( + ) |
<sp> | 在正數(shù)前面顯示空格 |
# | 在八進(jìn)制數(shù)前面顯示零('0'),在十六進(jìn)制前面顯示'0x'或者'0X'(取決于用的是'x'還是'X') |
0 | 顯示的數(shù)字前面填充'0'而不是默認(rèn)的空格 |
% | '%%'輸出一個單一的'%' |
(var) | 映射變量(字典參數(shù)) |
m.n. | m 是顯示的最小總寬度,n 是小數(shù)點(diǎn)后的位數(shù)(如果可用的話) |
Python2.6 開始,新增了一種格式化字符串的函數(shù) str.format(),它增強(qiáng)了字符串格式化的功能。
python三引號允許一個字符串跨多行,字符串中可以包含換行符、制表符以及其他特殊字符。實(shí)例如下
#!/usr/bin/python3
para_str = """這是一個多行字符串的實(shí)例
多行字符串可以使用制表符
TAB ( \t )。
也可以使用換行符 [ \n ]。
"""
print (para_str)
以上實(shí)例執(zhí)行結(jié)果為:
這是一個多行字符串的實(shí)例 多行字符串可以使用制表符 TAB ( )。 也可以使用換行符 [ ]。
三引號讓程序員從引號和特殊字符串的泥潭里面解脫出來,自始至終保持一小塊字符串的格式是所謂的WYSIWYG(所見即所得)格式的。
一個典型的用例是,當(dāng)你需要一塊HTML或者SQL時,這時用字符串組合,特殊字符串轉(zhuǎn)義將會非常的繁瑣。
errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
cursor.execute('''
CREATE TABLE users (
login VARCHAR(8),
uid INTEGER,
prid INTEGER)
''')
還記得我們在注釋相關(guān)章節(jié)中介紹的多行注釋嘛?三引號的另一種用途就是用來做為多行注釋使用。
f-string 是 python3.6 之后版本添加的,稱之為字面量格式化字符串,是新的格式化字符串的語法。
之前我們習(xí)慣用百分號 (%):
name = 'W3Cschool'
print('Hello %s' % name)
運(yùn)行結(jié)果:
Hello W3Cschool
f-string 格式化字符串以 f 開頭,后面跟著字符串,字符串中的表達(dá)式用大括號 {} 包起來,它會將變量或表達(dá)式計(jì)算后的值替換進(jìn)去,實(shí)例如下:
name = 'W3Cschool'
print(f'Hello {name}') # 替換變量
print(f'{1+2}') # 使用表達(dá)式
w = {'name': 'W3Cschool', 'url': 'www.o2fo.com'}
print(f'{w["name"]}: {w["url"]}')
運(yùn)行結(jié)果:
Hello W3Cschool
3
W3Cschool: www.o2fo.com
用了這種方式明顯更簡單了,不用再去判斷使用 %s,還是 %d。
在 Python 3.8 的版本中可以使用 = 符號來拼接運(yùn)算表達(dá)式與結(jié)果:
x = 1
print(f'{x+1}') # Python 3.6
x = 1
print(f'{x+1=}') # Python 3.8
運(yùn)行結(jié)果(由于在線idepython版本不支持3.8,所以不提供在線運(yùn)行案例):
2
x+1=2
在Python2中,普通字符串是以8位ASCII碼進(jìn)行存儲的,而Unicode字符串則存儲為16位unicode字符串,這樣能夠表示更多的字符集。使用的語法是在字符串前面加上前綴 u。
在Python3中,所有的字符串都是Unicode字符串。
Python 的字符串常用內(nèi)建函數(shù)如下:
序號 | 方法及描述 |
---|---|
1 |
capitalize()
|
2 | 返回一個指定的寬度 width 居中的字符串,fillchar 為填充的字符,默認(rèn)為空格。 |
3 | 返回 str 在 string 里面出現(xiàn)的次數(shù),如果指定 beg 或者 end,則返回指定范圍內(nèi) str 出現(xiàn)的次數(shù) |
4 | Python3 中沒有 decode 方法,但我們可以使用 bytes 對象的 decode() 方法來解碼給定的 bytes 對象,這個 bytes 對象可以由 str.encode() 來編碼返回。 |
5 |
encode(encoding='UTF-8',errors='strict') 以 encoding 指定的編碼格式編碼字符串,如果出錯默認(rèn)報(bào)?ValueError ?異常,除非 errors 指定的是'ignore'或者'replace' |
6 |
endswith(suffix, beg=0, end=len(string))
|
7 | 把字符串 string 中的 tab 符號轉(zhuǎn)為空格,tab 符號默認(rèn)的空格數(shù)是 8 。 |
8 | 檢測 str 是否包含在字符串中,如果指定范圍 beg 和 end ,則檢查是否包含在指定范圍內(nèi),如果包含,返回開始的索引值,否則返回-1 |
9 | 跟find()方法一樣,只不過如果str不在字符串中會報(bào)一個異常。 |
10 | 如果字符串至少有一個字符并且所有字符都是字母或數(shù)字則返回 True,否則返回 False |
11 | 如果字符串至少有一個字符并且所有字符都是字母或中文字則返回 True, 否則返回 False |
12 | 如果字符串只包含數(shù)字則返回 True 否則返回 False.. |
13 | 如果字符串中包含至少一個區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是小寫,則返回 True,否則返回 False |
14 | 如果字符串中只包含數(shù)字字符,則返回 True,否則返回 False |
15 | 如果字符串中只包含空白,則返回 True,否則返回 False. |
16 | 如果字符串是標(biāo)題化的(見 title())則返回 True,否則返回 False |
17 | 如果字符串中包含至少一個區(qū)分大小寫的字符,并且所有這些(區(qū)分大小寫的)字符都是大寫,則返回 True,否則返回 False |
18 | 以指定字符串作為分隔符,將 seq 中所有的元素(的字符串表示)合并為一個新的字符串 |
19 | 返回字符串長度 |
20 | 返回一個原字符串左對齊,并使用 fillchar 填充至長度 width 的新字符串,fillchar 默認(rèn)為空格。 |
21 | 轉(zhuǎn)換字符串中所有大寫字符為小寫. |
22 | 截掉字符串左邊的空格或指定字符。 |
23 | 創(chuàng)建字符映射的轉(zhuǎn)換表,對于接受兩個參數(shù)的最簡單的調(diào)用方式,第一個參數(shù)是字符串,表示需要轉(zhuǎn)換的字符,第二個參數(shù)也是字符串表示轉(zhuǎn)換的目標(biāo)。 |
24 | 返回字符串 str 中最大的字母。 |
25 | 返回字符串 str 中最小的字母。 |
26 | 把 將字符串中的 old 替換成 new,如果 max 指定,則替換不超過 max 次。 |
27 | 類似于 find()函數(shù),不過是從右邊開始查找. |
28 | 類似于 index(),不過是從右邊開始. |
29 | 返回一個原字符串右對齊,并使用fillchar(默認(rèn)空格)填充至長度 width 的新字符串 |
30 | 刪除字符串末尾的空格或指定字符。 |
31 | 以 str 為分隔符截取字符串,如果 num 有指定值,則僅截取 num+1 個子字符串 |
32 | 按照行('\r', '\r\n', \n')分隔,返回一個包含各行作為元素的列表,如果參數(shù) keepends 為 False,不包含換行符,如果為 True,則保留換行符。 |
33 | 檢查字符串是否是以指定子字符串 substr 開頭,是則返回 True,否則返回 False。如果beg 和 end 指定值,則在指定范圍內(nèi)檢查。 |
34 | 在字符串上執(zhí)行 lstrip()和 rstrip() |
35 | 將字符串中大寫轉(zhuǎn)換為小寫,小寫轉(zhuǎn)換為大寫 |
36 | 返回"標(biāo)題化"的字符串,就是說所有單詞都是以大寫開始,其余字母均為小寫(見 istitle()) |
37 | 根據(jù) str 給出的表(包含 256 個字符)轉(zhuǎn)換 string 的字符, 要過濾掉的字符放到 deletechars 參數(shù)中 |
38 | 轉(zhuǎn)換字符串中的小寫字母為大寫 |
39 | 返回長度為 width 的字符串,原字符串右對齊,前面填充0 |
40 | 檢查字符串是否只包含十進(jìn)制字符,如果是返回 true,否則返回 false。 |
更多建議: