Copyright
前言
第一章：數(shù)據(jù)結(jié)構(gòu)和算法
1. 1.1 解壓序列賦值給多個(gè)變量
2. 1.2 解壓可迭代對(duì)象賦值給多個(gè)變量
3. 1.3 保留最后N個(gè)元素
4. 1.4 查找最大或最小的N個(gè)元素
5. 1.5 實(shí)現(xiàn)一個(gè)優(yōu)先級(jí)隊(duì)列
6. 1.6 字典中的鍵映射多個(gè)值
7. 1.7 字典排序
8. 1.8 字典的運(yùn)算
9. 1.9 查找兩字典的相同點(diǎn)
10. 1.10 刪除序列相同元素并保持順序
11. 1.11 命名切片
12. 1.12 序列中出現(xiàn)次數(shù)最多的元素
13. 1.13 通過某個(gè)關(guān)鍵字排序一個(gè)字典列表
14. 1.14 排序不支持原生比較的對(duì)象
15. 1.15 通過某個(gè)字段將記錄分組
16. 1.16 過濾序列元素
17. 1.17 從字典中提取子集
18. 1.18 映射名稱到序列元素
19. 1.19 轉(zhuǎn)換并同時(shí)計(jì)算數(shù)據(jù)
20. 1.20 合并多個(gè)字典或映射
第二章：字符串和文本
1. 2.1 使用多個(gè)界定符分割字符串
2. 2.2 字符串開頭或結(jié)尾匹配
3. 2.3 用Shell通配符匹配字符串
4. 2.4 字符串匹配和搜索
5. 2.5 字符串搜索和替換
6. 2.6 字符串忽略大小寫的搜索替換
7. 2.7 最短匹配模式
8. 2.8 多行匹配模式
9. 2.9 將Unicode文本標(biāo)準(zhǔn)化
10. 2.10 在正則式中使用Unicode
11. 2.11 刪除字符串中不需要的字符
12. 2.12 審查清理文本字符串
13. 2.13 字符串對(duì)齊
14. 2.14 合并拼接字符串
15. 2.15 字符串中插入變量
16. 2.16 以指定列寬格式化字符串
17. 2.17 在字符串中處理html和xml
18. 2.18 字符串令牌解析
19. 2.19 實(shí)現(xiàn)一個(gè)簡單的遞歸下降分析器
20. 2.20 字節(jié)字符串上的字符串操作
第三章：數(shù)字日期和時(shí)間
1. 3.1 數(shù)字的四舍五入
2. 3.2 執(zhí)行精確的浮點(diǎn)數(shù)運(yùn)算
3. 3.3 數(shù)字的格式化輸出
4. 3.4 二八十六進(jìn)制整數(shù)
5. 3.5 字節(jié)到大整數(shù)的打包與解包
6. 3.6 復(fù)數(shù)的數(shù)學(xué)運(yùn)算
7. 3.7 無窮大與NaN
8. 3.8 分?jǐn)?shù)運(yùn)算
9. 3.9 大型數(shù)組運(yùn)算
10. 3.10 矩陣與線性代數(shù)運(yùn)算
11. 3.11 隨機(jī)選擇
12. 3.12 基本的日期與時(shí)間轉(zhuǎn)換
13. 3.13 計(jì)算最后一個(gè)周五的日期
14. 3.14 計(jì)算當(dāng)前月份的日期范圍
15. 3.15 字符串轉(zhuǎn)換為日期
16. 3.16 結(jié)合時(shí)區(qū)的日期操作
第四章：迭代器與生成器
1. 4.1 手動(dòng)遍歷迭代器
2. 4.2 代理迭代
3. 4.3 使用生成器創(chuàng)建新的迭代模式
4. 4.4 實(shí)現(xiàn)迭代器協(xié)議
5. 4.5 反向迭代
6. 4.6 帶有外部狀態(tài)的生成器函數(shù)
7. 4.7 迭代器切片
8. 4.8 跳過可迭代對(duì)象的開始部分
9. 4.9 排列組合的迭代
10. 4.10 序列上索引值迭代
11. 4.11 同時(shí)迭代多個(gè)序列
12. 4.12 不同集合上元素的迭代
13. 4.13 創(chuàng)建數(shù)據(jù)處理管道
14. 4.14 展開嵌套的序列
15. 4.15 順序迭代合并后的排序迭代對(duì)象
16. 4.16 迭代器代替while無限循環(huán)
第五章：文件與IO
1. 5.1 讀寫文本數(shù)據(jù)
2. 5.2 打印輸出至文件中
3. 5.3 使用其他分隔符或行終止符打印
4. 5.4 讀寫字節(jié)數(shù)據(jù)
5. 5.5 文件不存在才能寫入
6. 5.6 字符串的I/O操作
7. 5.7 讀寫壓縮文件
8. 5.8 固定大小記錄的文件迭代
9. 5.9 讀取二進(jìn)制數(shù)據(jù)到可變緩沖區(qū)中
10. 5.10 內(nèi)存映射的二進(jìn)制文件
11. 5.11 文件路徑名的操作
12. 5.12 測試文件是否存在
13. 5.13 獲取文件夾中的文件列表
14. 5.14 忽略文件名編碼
15. 5.15 打印不合法的文件名
16. 5.16 增加或改變已打開文件的編碼
17. 5.17 將字節(jié)寫入文本文件
18. 5.18 將文件描述符包裝成文件對(duì)象
19. 5.19 創(chuàng)建臨時(shí)文件和文件夾
20. 5.20 與串行端口的數(shù)據(jù)通信
21. 5.21 序列化Python對(duì)象
第六章：數(shù)據(jù)編碼和處理
1. 6.1 讀寫CSV數(shù)據(jù)
2. 6.2 讀寫JSON數(shù)據(jù)
3. 6.3 解析簡單的XML數(shù)據(jù)
4. 6.4 增量式解析大型XML文件
5. 6.5 將字典轉(zhuǎn)換為XML
6. 6.6 解析和修改XML
7. 6.7 利用命名空間解析XML文檔
8. 6.8 與關(guān)系型數(shù)據(jù)庫的交互
9. 6.9 編碼和解碼十六進(jìn)制數(shù)
10. 6.10 編碼解碼Base64數(shù)據(jù)
11. 6.11 讀寫二進(jìn)制數(shù)組數(shù)據(jù)
12. 6.12 讀取嵌套和可變長二進(jìn)制數(shù)據(jù)
13. 6.13 數(shù)據(jù)的累加與統(tǒng)計(jì)操作
第八章：類與對(duì)象
1. 8.1 改變對(duì)象的字符串顯示
2. 8.2 自定義字符串的格式化
3. 8.3 讓對(duì)象支持上下文管理協(xié)議
4. 8.4 創(chuàng)建大量對(duì)象時(shí)節(jié)省內(nèi)存方法
5. 8.5 在類中封裝屬性名
6. 8.6 創(chuàng)建可管理的屬性
7. 8.7 調(diào)用父類方法
8. 8.8 子類中擴(kuò)展property

第七章：函數(shù)

第九章：元編程

第十章：模塊與包

第十一章：網(wǎng)絡(luò)與Web編程

第十二章：并發(fā)編程

第十三章：腳本編程與系統(tǒng)管理

第十四章：測試調(diào)試和異常

第十五章：C語言擴(kuò)展

附錄A

關(guān)于譯者

Roadmap

閱讀(12.9k) 書簽贊(0) 我要糾錯(cuò)

2.14 合并拼接字符串

2018-02-24 15:26 更新

問題

你想將幾個(gè)小的字符串合并為一個(gè)大的字符串

解決方案

如果你想要合并的字符串是在一個(gè)序列或者 iterable 中，那么最快的方式就是使用 join() 方法。比如：

>>> parts = ['Is', 'Chicago', 'Not', 'Chicago?']
>>> ' '.join(parts)
'Is Chicago Not Chicago?'
>>> ','.join(parts)
'Is,Chicago,Not,Chicago?'
>>> ''.join(parts)
'IsChicagoNotChicago?'
>>>

初看起來，這種語法看上去會(huì)比較怪，但是 join() 被指定為字符串的一個(gè)方法。這樣做的部分原因是你想去連接的對(duì)象可能來自各種不同的數(shù)據(jù)序列(比如列表，元組，字典，文件，集合或生成器等)，如果在所有這些對(duì)象上都定義一個(gè) join() 方法明顯是冗余的。因此你只需要指定你想要的分割字符串并調(diào)用他的 join() 方法去將文本片段組合起來。

如果你僅僅只是合并少數(shù)幾個(gè)字符串，使用加號(hào)(+)通常已經(jīng)足夠了：

>>> a = 'Is Chicago'
>>> b = 'Not Chicago?'
>>> a + ' ' + b
'Is Chicago Not Chicago?'
>>>

加號(hào)(+)操作符在作為一些復(fù)雜字符串格式化的替代方案的時(shí)候通常也工作的很好，比如：

>>> print('{} {}'.format(a,b))
Is Chicago Not Chicago?
>>> print(a + ' ' + b)
Is Chicago Not Chicago?
>>>

如果你想在源碼中將兩個(gè)字面字符串合并起來，你只需要簡單的將它們放到一起，不需要用加號(hào)(+)。比如：

>>> a = 'Hello' 'World'
>>> a
'HelloWorld'
>>>

討論

字符串合并可能看上去并不需要用一整節(jié)來討論。但是不應(yīng)該小看這個(gè)問題，程序員通常在字符串格式化的時(shí)候因?yàn)檫x擇不當(dāng)而給應(yīng)用程序帶來嚴(yán)重性能損失。

最重要的需要引起注意的是，當(dāng)我們使用加號(hào)(+)操作符去連接大量的字符串的時(shí)候是非常低效率的，因?yàn)榧犹?hào)連接會(huì)引起內(nèi)存復(fù)制以及垃圾回收操作。特別的，你永遠(yuǎn)都不應(yīng)像下面這樣寫字符串連接代碼：

s = ''
for p in parts:
    s += p

這種寫法會(huì)比使用 join() 方法運(yùn)行的要慢一些，因?yàn)槊恳淮螆?zhí)行+=操作的時(shí)候會(huì)創(chuàng)建一個(gè)新的字符串對(duì)象。你最好是先收集所有的字符串片段然后再將它們連接起來。

一個(gè)相對(duì)比較聰明的技巧是利用生成器表達(dá)式(參考1.19小節(jié))轉(zhuǎn)換數(shù)據(jù)為字符串的同時(shí)合并字符串，比如：

>>> data = ['ACME', 50, 91.1]
>>> ','.join(str(d) for d in data)
'ACME,50,91.1'
>>>

同樣還得注意不必要的字符串連接操作。有時(shí)候程序員在沒有必要做連接操作的時(shí)候仍然多此一舉。比如在打印的時(shí)候：

print(a + ':' + b + ':' + c) # Ugly
print(':'.join([a, b, c])) # Still ugly
print(a, b, c, sep=':') # Better

當(dāng)混合使用I/O操作和字符串連接操作的時(shí)候，有時(shí)候需要仔細(xì)研究你的程序。比如，考慮下面的兩端代碼片段：

# Version 1 (string concatenation)
f.write(chunk1 + chunk2)

# Version 2 (separate I/O operations)
f.write(chunk1)
f.write(chunk2)

如果兩個(gè)字符串很小，那么第一個(gè)版本性能會(huì)更好些，因?yàn)镮/O系統(tǒng)調(diào)用天生就慢。另外一方面，如果兩個(gè)字符串很大，那么第二個(gè)版本可能會(huì)更加高效，因?yàn)樗苊饬藙?chuàng)建一個(gè)很大的臨時(shí)結(jié)果并且要復(fù)制大量的內(nèi)存塊數(shù)據(jù)。還是那句話，有時(shí)候是需要根據(jù)你的應(yīng)用程序特點(diǎn)來決定應(yīng)該使用哪種方案。

最后談一下，如果你準(zhǔn)備編寫構(gòu)建大量小字符串的輸出代碼，你最好考慮下使用生成器函數(shù)，利用yield語句產(chǎn)生輸出片段。比如：

def sample():
    yield 'Is'
    yield 'Chicago'
    yield 'Not'
    yield 'Chicago?'

這種方法一個(gè)有趣的方面是它并沒有對(duì)輸出片段到底要怎樣組織做出假設(shè)。例如，你可以簡單的使用 join() 方法將這些片段合并起來：

text = ''.join(sample())

或者你也可以將字符串片段重定向到I/O：

for part in sample():
    f.write(part)

再或者你還可以寫出一些結(jié)合I/O操作的混合方案：

def combine(source, maxsize):
    parts = []
    size = 0
    for part in source:
        parts.append(part)
        size += len(part)
        if size > maxsize:
            yield ''.join(parts)
            parts = []
            size = 0
        yield ''.join(parts)

# 結(jié)合文件操作
with open('filename', 'w') as f:
    for part in combine(sample(), 32768):
        f.write(part)

這里的關(guān)鍵點(diǎn)在于原始的生成器函數(shù)并不需要知道使用細(xì)節(jié)，它只負(fù)責(zé)生成字符串片段就行了。

以上內(nèi)容是否對(duì)您有幫助：

← 2.13 字符串對(duì)齊

2.15 字符串中插入變量 →

寫筆記

我要補(bǔ)充

2.14 合并拼接字符串

問題

解決方案

討論

推薦文章

推薦教程

推薦課程