1: 更改字符串的大小写
Python 的字符串类型提供了许多对字符串的大小写起作用的函数。这些函数包括
- str.casefold
- str.upper
- str.lower
- str.capitalize
- str.title
- str.swapcase
对于 unicode 字符串(Python 3 中的默认值),这些操作不是 1:1 映射或可逆的。大多数这些操作都是为了显示目的,而不是为了规范化。
Python 3.x Version ≥ 3.3
str.casefold()
str.casefold创建的字符串小写,适用于大小写不敏感的比较。它比 str.lower 更激进,可能会修改已经小写的字符串或导致字符串长度增加,并且不用于显示目的。
"X?Σ".casefold()
# 'xssσ'yuyu
"X?Σ".lower()
# 'x??'
统一码联盟在其网站上的 CaseFolding.txt 文件中定义了在大小写折叠下进行的转换。
str.upper()
str.upper 获取字符串中的每个字符并将其转换为大写字母,例如
"This is a 'string'.".upper()
# "THIS IS A 'STRING'."
str.lower()
str.lower 的作用与此相反;它获取字符串中的每个字符,并将其转换为小写字母:
"This IS a 'string'.".lower()
# "this is a 'string'."
str.capitalize()
str.capitalize 返回字符串的大写版本,即第一个字符大写,其余字符小写:
"this Is A 'String'.".capitalize() # Capitalizes the first character and lowercases all others
# "This is a 'string'."
str.title()
str.title 返回字符串的标题大小写版本,即单词开头的每个字母都大写,其他字母小写:
"this Is a 'String'".title()
# "This Is A 'String'"
str.swapcase() str.swapcase 返回一个新的字符串对象,其中所有小写字母被替换为大写字母,所有大写字母被替换为小写字母:
"this iS A STRiNG".swapcase() #Swaps case of each character
# "THIS Is a strIng"
作为 str 类方法使用
值得注意的是,这些方法既可以在字符串对象上调用(如上图所示),也可以作为 str 类的类方法调用(明确调用 str.upper 等)。
str.upper("This is a 'string'")
# "THIS IS A 'STRING'"
例如,在 “映射 ”函数中对许多字符串同时应用其中一种方法时,这种方法最为有用。
map(str.upper,["These","are","some","'strings'"])
# ['THESE', 'ARE', 'SOME', "'STRINGS'"]
2: str.translate: 翻译字符串中的字符
Python 支持 str 类型上的 translate 方法,它允许您指定翻译表(用于替换)以及在此过程中应删除的任何字符。
str.translate(table[, deletechars])
Parameter | Description |
table | 它是一个查找表,定义了从一个字符到另一个字符的映射。 |
deletechars | 要从字符串中删除的字符列表。 |
使用 maketrans 方法 (Python 3 中的 str.maketrans 和 Python 2 中的 string.maketrans),可以生成翻译表。
>>> translation_table = str.maketrans("aeiou", "12345")
>>> my_string = "This is a string!"
>>> translated = my_string.translate(translation_table)
'Th3s 3s 1 str3ng!'
translate 方法返回的字符串是原始字符串的翻译副本。
如果只需要删除字符,可以将表参数设置为 "None"。
>>> 'this syntax is very useful'.translate('aeiou')
'ths syntx s vry sfl'
3: str.format 和 f-strings: 将数值格式化为字符串
Python 通过 2.6 版引入的 str.format 函数和 3.6 版引入的 f-strings 函数提供了字符串插值和格式化功能。
给定以下变量
i = 10
f = 1.5
s = "foo"
l = ['a', 1, 2]
d = {'a': 1, 2: 'foo'}
以下陈述都是等价的
"10 1.5 foo ['a', 1, 2] {'a': 1, 2: 'foo'}"
>>> "{} {} {} {} {}".format(i, f, s, l, d)
>>> str.format("{} {} {} {} {}", i, f, s, l, d)
>>> "{0} {1} {2} {3} {4}".format(i, f, s, l, d)
>>> "{0:d} {1:0.1f} {2} {3!r} {4!r}".format(i, f, s, l, d)
>>> "{i:d} {f:0.1f} {s} {l!r} {d!r}".format(i=i, f=f, s=s, l=l, d=d)
>>> f"{i} {f} {s} {l} {d}"
>>> f"{i:d} {f:0.1f} {s} {l!r} {d!r}"
作为参考,Python 也支持用于字符串格式化的 C 风格限定符。下面的示例与上面的示例是等价的,但由于 str.format 版本在灵活性、符号一致性和可扩展性方面的优势,我们更倾向于使用 str.format:
"%d %0.1f %s %r %r" % (i, f, s, l, d)
"%(i)d %(f)0.1f %(s)s %(l)r %(d)r" % dict(i=i, f=f, s=s, l=l, d=d)
str.format 中用于插值的大括号也可以编号,以减少格式化字符串时的重复。例如
"I am from Australia. I love cupcakes from Australia!"
>>> "I am from {}. I love cupcakes from {}!".format("Australia", "Australia")
>>> "I am from {0}. I love cupcakes from {0}!".format("Australia")
Python 官方文档一如既往地详尽,pyformat.info: PyFormat: Using % and .format() for great good! 则提供了大量带有详细解释的示例。
此外,{ 和 } ”字符可以用双括号转义:
"{'a': 5, 'b': 6}"
>>> "{{'{}': {}, '{}': {}}}".format("a", 5, "b", 6)
>>> f"{{'{'a'}': {5}, '{'b'}': {6}}}"
更多信息请参阅字符串格式化。PEP 3101 PEP 3101 – Advanced String Formatting | peps.python.orgFollowing system colour schemeSelected dark colour schemeSelected light colour scheme 中提出了 str.format(),PEP 498 PEP 498 – Literal String Interpolation | peps.python.orgFollowing system colour schemeSelected dark colour schemeSelected light colour scheme 中提出了 f-strings。
4: 字符串模块的实用常量
Python 的 string 模块为字符串相关操作提供了常量。要使用它们,请导入 string 模块:
import string
string.ascii_letters:
ascii_lowercase 和 ascii_uppercase 的并集:
>>> string.ascii_letters
'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
string.ascii_lowercase:
包含所有小写 ASCII 字符:
>>> string.ascii_lowercase
'abcdefghijklmnopqrstuvwxyz'
string.ascii_uppercase:
包含所有大写 ASCII 字符:
>>> string.ascii_uppercase
'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
string.digits:
包含所有十进制数字字符:
>>> string.digits
'0123456789'
string.hexdigits:
包含所有十六进制数字字符:
>>> string.hexdigits
'0123456789abcdefABCDEF'
string.octdigits:
包含所有八进制数字字符:
>>> string.octdigits
'01234567'
string.punctuation:
包含所有在 C 语言区被视为标点符号的字符:
>>> string.punctuation
'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
string.whitespace:
包含所有视为空白的 ASCII 字符:
>>> string.whitespace
' \t\n\r\x0b\x0c'
在脚本模式下,print(string.whitespace) 将打印实际字符,使用 str 可以获得上面返回的字符串。
string.printable:
包含所有可打印的字符;由 string.digits、string.ascii_letters、string.punctuation 和 string.whitespace组合而成。
>>> string.printable
'0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~\t\n\r\x0b\x0c'
5: 删除字符串中不需要的前导字符/尾随字符
本程序提供了三种方法,用于从字符串中去除前导字符和尾部字符: str.strip、str.rstrip 和 str.lstrip。这三个方法具有相同的签名,都会返回一个已删除多余字符的新字符串对象。
str.strip([chars])
str.strip 作用于给定的字符串,并删除(strips)参数 chars 中包含的任何前导字符或尾部字符;如果未提供 chars 或 chars 为 None,则默认删除所有空白字符。例如
>>> " a line with leading and trailing space ".strip()
'a line with leading and trailing space'
如果提供 chars,则会从返回的字符串中删除其中包含的所有字符。例如
>>> ">>> a Python prompt".strip('> ') # strips '>' character and space character
'a Python prompt'
str.rstrip([chars]) 和 str.lstrip([chars])
这些方法的语义和参数与 str.strip() 类似,区别在于它们的起始方向。str.rstrip() 从字符串的末尾开始,而 str.lstrip() 则从字符串的开始分割。
例如,使用 str.rstrip:
>>> " spacious string ".rstrip()
' spacious string'
而使用 str.lstrip:
>>> " spacious string ".lstrip()
'spacious string '