云计算、AI、云原生、大数据等一站式技术学习平台

网站首页 > 教程文章 正文

python散装笔记——41: 字符串的方法(1)

jxf315 2025-02-17 12:35:49 教程文章 14 ℃

1: 更改字符串的大小写

Python 的字符串类型提供了许多对字符串的大小写起作用的函数。这些函数包括

  • str.casefold
  • str.upper
  • str.lower
  • str.capitalize
  • str.title
  • str.swapcase

对于 unicode 字符串(Python 3 中的默认值),这些操作不是 1:1 映射或可逆的。大多数这些操作都是为了显示目的,而不是为了规范化。

Python 3.x Version ≥ 3.3

str.casefold()

str.casefold创建的字符串小写,适用于大小写不敏感的比较。它比 str.lower 更激进,可能会修改已经小写的字符串或导致字符串长度增加,并且不用于显示目的。

"X?Σ".casefold()
# 'xssσ'yuyu

"X?Σ".lower()
# 'x??'

统一码联盟在其网站上的 CaseFolding.txt 文件中定义了在大小写折叠下进行的转换。

str.upper()

str.upper 获取字符串中的每个字符并将其转换为大写字母,例如

"This is a 'string'.".upper()
# "THIS IS A 'STRING'."

str.lower()

str.lower 的作用与此相反;它获取字符串中的每个字符,并将其转换为小写字母:

"This IS a 'string'.".lower()
# "this is a 'string'."

str.capitalize()

str.capitalize 返回字符串的大写版本,即第一个字符大写,其余字符小写:

"this Is A 'String'.".capitalize() # Capitalizes the first character and lowercases all others
# "This is a 'string'."

str.title()

str.title 返回字符串的标题大小写版本,即单词开头的每个字母都大写,其他字母小写:

"this Is a 'String'".title()
# "This Is A 'String'"

str.swapcase() str.swapcase 返回一个新的字符串对象,其中所有小写字母被替换为大写字母,所有大写字母被替换为小写字母:

"this iS A STRiNG".swapcase() #Swaps case of each character
# "THIS Is a strIng"

作为 str 类方法使用

值得注意的是,这些方法既可以在字符串对象上调用(如上图所示),也可以作为 str 类的类方法调用(明确调用 str.upper 等)。

str.upper("This is a 'string'")
# "THIS IS A 'STRING'"

例如,在 “映射 ”函数中对许多字符串同时应用其中一种方法时,这种方法最为有用。

map(str.upper,["These","are","some","'strings'"])
# ['THESE', 'ARE', 'SOME', "'STRINGS'"]

2: str.translate: 翻译字符串中的字符

Python 支持 str 类型上的 translate 方法,它允许您指定翻译表(用于替换)以及在此过程中应删除的任何字符。

str.translate(table[, deletechars])

Parameter

Description

table

它是一个查找表,定义了从一个字符到另一个字符的映射。

deletechars

要从字符串中删除的字符列表。

使用 maketrans 方法 (Python 3 中的 str.maketrans 和 Python 2 中的 string.maketrans),可以生成翻译表。

>>> translation_table = str.maketrans("aeiou", "12345")
>>> my_string = "This is a string!"
>>> translated = my_string.translate(translation_table)
'Th3s 3s 1 str3ng!'

translate 方法返回的字符串是原始字符串的翻译副本。

如果只需要删除字符,可以将表参数设置为 "None"。

>>> 'this syntax is very useful'.translate('aeiou')
'ths syntx s vry sfl'

3: str.format 和 f-strings: 将数值格式化为字符串

Python 通过 2.6 版引入的 str.format 函数和 3.6 版引入的 f-strings 函数提供了字符串插值和格式化功能。

给定以下变量

i = 10
f = 1.5
s = "foo"
l = ['a', 1, 2]
d = {'a': 1, 2: 'foo'}

以下陈述都是等价的

"10 1.5 foo ['a', 1, 2] {'a': 1, 2: 'foo'}"

>>> "{} {} {} {} {}".format(i, f, s, l, d)

>>> str.format("{} {} {} {} {}", i, f, s, l, d)

>>> "{0} {1} {2} {3} {4}".format(i, f, s, l, d)

>>> "{0:d} {1:0.1f} {2} {3!r} {4!r}".format(i, f, s, l, d)

>>> "{i:d} {f:0.1f} {s} {l!r} {d!r}".format(i=i, f=f, s=s, l=l, d=d)

>>> f"{i} {f} {s} {l} {d}"

>>> f"{i:d} {f:0.1f} {s} {l!r} {d!r}"

作为参考,Python 也支持用于字符串格式化的 C 风格限定符。下面的示例与上面的示例是等价的,但由于 str.format 版本在灵活性、符号一致性和可扩展性方面的优势,我们更倾向于使用 str.format

"%d %0.1f %s %r %r" % (i, f, s, l, d)

"%(i)d %(f)0.1f %(s)s %(l)r %(d)r" % dict(i=i, f=f, s=s, l=l, d=d)

str.format 中用于插值的大括号也可以编号,以减少格式化字符串时的重复。例如

"I am from Australia. I love cupcakes from Australia!"

>>> "I am from {}. I love cupcakes from {}!".format("Australia", "Australia")

>>> "I am from {0}. I love cupcakes from {0}!".format("Australia")

Python 官方文档一如既往地详尽,pyformat.info: PyFormat: Using % and .format() for great good! 则提供了大量带有详细解释的示例。

此外,{} ”字符可以用双括号转义:

"{'a': 5, 'b': 6}"

>>> "{{'{}': {}, '{}': {}}}".format("a", 5, "b", 6)

>>> f"{{'{'a'}': {5}, '{'b'}': {6}}}"

更多信息请参阅字符串格式化。PEP 3101 PEP 3101 – Advanced String Formatting | peps.python.orgFollowing system colour schemeSelected dark colour schemeSelected light colour scheme 中提出了 str.format(),PEP 498 PEP 498 – Literal String Interpolation | peps.python.orgFollowing system colour schemeSelected dark colour schemeSelected light colour scheme 中提出了 f-strings

4: 字符串模块的实用常量

Python 的 string 模块为字符串相关操作提供了常量。要使用它们,请导入 string 模块:

import string

string.ascii_letters:

ascii_lowercase 和 ascii_uppercase 的并集:

>>> string.ascii_letters
'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

string.ascii_lowercase:

包含所有小写 ASCII 字符:

>>> string.ascii_lowercase
'abcdefghijklmnopqrstuvwxyz'

string.ascii_uppercase:

包含所有大写 ASCII 字符:

>>> string.ascii_uppercase
'ABCDEFGHIJKLMNOPQRSTUVWXYZ'

string.digits:

包含所有十进制数字字符:

>>> string.digits
'0123456789'

string.hexdigits:

包含所有十六进制数字字符:

>>> string.hexdigits
'0123456789abcdefABCDEF'

string.octdigits:

包含所有八进制数字字符:

>>> string.octdigits
'01234567'

string.punctuation:

包含所有在 C 语言区被视为标点符号的字符:

>>> string.punctuation
'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

string.whitespace:

包含所有视为空白的 ASCII 字符:

>>> string.whitespace
' \t\n\r\x0b\x0c'

在脚本模式下,print(string.whitespace) 将打印实际字符,使用 str 可以获得上面返回的字符串。

string.printable:

包含所有可打印的字符;由 string.digitsstring.ascii_lettersstring.punctuationstring.whitespace组合而成。

>>> string.printable
'0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~\t\n\r\x0b\x0c'

5: 删除字符串中不需要的前导字符/尾随字符

本程序提供了三种方法,用于从字符串中去除前导字符和尾部字符: str.stripstr.rstripstr.lstrip。这三个方法具有相同的签名,都会返回一个已删除多余字符的新字符串对象。

str.strip([chars])

str.strip 作用于给定的字符串,并删除(strips)参数 chars 中包含的任何前导字符或尾部字符;如果未提供 charscharsNone,则默认删除所有空白字符。例如

>>> " a line with leading and trailing space ".strip()
'a line with leading and trailing space'

如果提供 chars,则会从返回的字符串中删除其中包含的所有字符。例如

>>> ">>> a Python prompt".strip('> ') # strips '>' character and space character
'a Python prompt'

str.rstrip([chars])str.lstrip([chars])

这些方法的语义和参数与 str.strip() 类似,区别在于它们的起始方向。str.rstrip() 从字符串的末尾开始,而 str.lstrip() 则从字符串的开始分割。

例如,使用 str.rstrip

>>> " spacious string ".rstrip()
' spacious string'

而使用 str.lstrip

>>> " spacious string ".lstrip()
'spacious string '

Tags:

最近发表
标签列表