在以往的文章中,我們介紹了很多對字符串?dāng)?shù)據(jù)進(jìn)行處理的方式,但是對于格式化文本段落的情況我們并沒有進(jìn)行介紹,因為小編對這方面的庫的了解并不是很多。直到小編接觸到了textwrap庫,小編才知道段落的操作能有多方便,今天我們就來介紹python格式化文本段落的庫——textwrap庫吧。
一、前言
前文是針對普通的字符串?dāng)?shù)據(jù)進(jìn)行處理。今天,我們要講解的textwrap庫,是對多文本進(jìn)行處理的庫。比如對于段落的縮進(jìn),填充,截取等,都可以通過textwrap庫進(jìn)行操作。
特別是自己編寫打印程序的時候,可以使用該庫進(jìn)行校正文檔非常便捷,大大的加快了文本格式的處理。話不多說,我們來一步步學(xué)習(xí)textwrap庫。
二、切割文檔
一般來說,一篇英文文檔在不考慮換行的情況下,默認(rèn)是填充整個文檔行才切換至下一行的。現(xiàn)在,我們需要保證每行必須有且僅有50個字符怎么辦?
我們可以使用textwrap.fill方法,具體代碼如下:
import textwrap
content = ""
with open('英文文檔.txt', 'r', encoding='utf-8') as f:
content = f.read()
print(content)
print("----")
print(textwrap.fill(content, width=50))
運行之后,分割線上下分別為原文檔與textwrap.fill處理后的文檔:
讀者可以自行測試,保證每行加上空格不多于50個字符,而且也沒有任何的縮進(jìn)效果。
三、文本縮進(jìn)
既然通過textwrap.fill達(dá)不到文檔縮進(jìn)的效果。下面我們再來認(rèn)識一個新的函數(shù)textwrap.indent()函數(shù)。
import textwrap
content = ""
with open('英文文檔.txt', 'r', encoding='utf-8') as f:
content = f.read()
print(textwrap.indent(content," "))
textwrap.indent()函數(shù)具有兩個參數(shù),一個是需要縮進(jìn)的字符串,另一個是匹配的縮進(jìn)字符。比如這里就是空了2格,那么字符串每行前面都會縮進(jìn)2格。
當(dāng)然,我們還可以選擇特定的行進(jìn)行縮進(jìn),textwrap.indent()函數(shù)還有第3個參數(shù)predicate,需要給它提供一個方法設(shè)置特定的規(guī)則。具體代碼如下:
import textwrap
def choice_line(line):
return len(line) % 2 == 0
content = ""
with open('英文文檔.txt', 'r', encoding='utf-8') as f:
content = f.read()
indent_str = textwrap.indent(content, " ",predicate=choice_line)
print(indent_str)
這里,博主設(shè)置的規(guī)則是,當(dāng)某行的字符串個數(shù)除2取余數(shù)等于0時,就縮進(jìn)。否則便不縮進(jìn)。運行之后,效果如下:
四、文本去縮進(jìn)
既然有縮進(jìn)文本,那么肯定就也有反向的操作去除縮進(jìn)。下面,我們來通過函數(shù)textwrap.dedent()來去除縮進(jìn)。
import textwrap
content = ""
with open('英文文檔.txt', 'r', encoding='utf-8') as f:
content = f.read()
indent_str = textwrap.indent(content, " ")
print(textwrap.dedent(indent_str))
textwrap.dedent()函數(shù)只有需要操作的文本一個參數(shù),效果如下:
這樣,我們就實現(xiàn)了去除縮進(jìn)。
五、截斷文本
除了縮進(jìn)與截斷之外,我們還可以通過textwrap庫截斷文本進(jìn)行操作。比如,我們常??吹侥承┵Y訊App簡介會這樣寫“某某什么什么等等[…]”描述,這就是截取某文開頭文字形成的結(jié)果字符串,textwrap.shorten正好可以完整實現(xiàn),而且不會截斷英文。
import textwrap
content = ""
with open('英文文檔.txt', 'r', encoding='utf-8') as f:
content = f.read()
print(textwrap.shorten(content, 100))
運行之后,效果如下:
到此這篇關(guān)于Python格式化文本段落庫——textwrap庫的文章就介紹到這了,更多Python學(xué)習(xí)內(nèi)容請搜索W3Cschool以前的文章或繼續(xù)瀏覽下面的相關(guān)文章。