当前位置:首页 > 编程知识 > 正文

python re.split用法介绍

一、基本概念

re.split()是Python正则表达式库re(regular expression)中提供的一个函数。该函数用于根据正则表达式模式分割字符串,得到一个由多个子字符串组成的列表。

re.split(pattern, string, maxsplit=0, flags=0)

其中,参数pattern是正则表达式,用于指定分隔符的模式;参数maxsplit是可选参数,用于指定分割次数,即最多分割的次数。如果没有指定,则不限制次数;参数flags是可选参数,用于指定正则表达式的匹配方式。

二、分割方式

re.split()是Python正则表达式库re(regular expression)中提供的一个函数。该函数用于根据正则表达式模式分割字符串,得到一个由多个子字符串组成的列表。

对于分割方式,re.split()提供了两种分割方式:基本分割和扩展分割。

1、基本分割

基本分割是指通过一个或多个字符进行分割。下面以空格为例进行演示。

import re

text = "hello world python"
result = re.split(" ", text)
print(result)

执行结果为:
['hello', 'world', 'python']

2、扩展分割

扩展分割是指通过使用正则表达式进行分割。下面以数字为分隔符进行演示。

import re

text = "hey,where1are2you3going?"
result = re.split("\d", text)
print(result)

执行结果为:
['hey,where', 'are', 'you', 'going?']

三、分割次数

re.split()的另一个可选参数是maxsplit,用于指定分割次数。如果未指定该参数,则不限制次数。

下面的示例演示了如何通过maxsplit指定分割次数。

import re

text = "a|b|c|d|e"
result = re.split("\|", text, maxsplit=2)
print(result)

执行结果为:
['a', 'b', 'c|d|e']

四、flags参数

re.split()的另一个可选参数是flags,用于指定正则表达式的匹配方式。

下面的示例演示了如何通过flags参数指定匹配方式。

import re

text = "aBcdEfG"
result1 = re.split("[A-Z]", text)
result2 = re.split("[A-Z]", text, flags = re.IGNORECASE)
print(result1)
print(result2)

执行结果为:
['a', 'bcd', 'f', '']
['a', 'bcd', 'f', '']

五、总结

通过本文的介绍,我们了解到re.split()函数是Python正则表达式库re中提供的一个有用函数,用于根据正则表达式模式分割字符串,得到一个由多个子字符串组成的列表。我们可以通过两种方式,基本分割和扩展分割,来完成分割操作。同时,我们还可以通过maxsplit参数指定分割次数,以及通过flags参数指定正则表达式的匹配方式。