您当前的位置:首页 > IT编程 > python
| C语言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 学术与代码 | cnn卷积神经网络 | gnn | 图像修复 | Keras | 数据集 | Neo4j | 自然语言处理 | 深度学习 | 医学CAD | 医学影像 | 超参数 | pointnet | pytorch |

自学教程:Python正则表达re模块之findall()函数详解

51自学网 2022-07-22 18:48:26
  python
这篇教程Python正则表达re模块之findall()函数详解写得很实用,希望能帮到您。

一、re.findall函数介绍

它在re.py中有定义:

def findall(pattern, string, flags=0):    """Return a list of all non-overlapping matches in the string.    If one or more capturing groups are present in the pattern, return    a list of groups; this will be a list of tuples if the pattern    has more than one group.    Empty matches are included in the result."""    return _compile(pattern, flags).findall(string)

返回string中所有与pattern匹配的全部字符串,返回形式为数组。

findall()函数的两种表示形式

import rekk = re.compile(r'/d+')kk.findall('one1two2three3four4')#[1,2,3,4] #注意此处findall()的用法,可传两个参数;kk = re.compile(r'/d+')re.findall(kk,"one123")#[1,2,3]

二、实例代码

后面会讲解代码里的各个部分,先列出来~

import re str = 'aabbabaabbaa'# 一个"."就是匹配除 /n (换行符)以外的任意一个字符print(re.findall(r'a.b',str))#['aab', 'aab']# *前面的字符出现0次或以上print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']# 贪婪,匹配从.*前面为开始到后面为结束的所有内容print(re.findall(r'a.*b',str))#['aabbabaabb']# 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']# 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容print(re.findall(r'a(.*?)b',str))#['a', '', 'a'] str = '''aabbab         aabbaa         bb'''     #后面多加了2个b# 没有把最后一个换行的aab算进来print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']# re.S不会对/n进行中断print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa/n         b']

三、re.findall中正则表达式(.*?)

字符串是

str = 'aabbabaabbaa'

1. 符号 . 就 是匹配除 /n (换行符)以外的任意一个字符

print(re.findall(r'a.b',str))#['aab', 'aab']

2.符号 * 前面的字符出现0次或以上

print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']

3.符号.* 贪婪,匹配从.*前面为开始到后面为结束的所有内容

print(re.findall(r'a.*b',str))#['aabbabaabb']

4.符号.*? 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取

print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']

5.符号(.*?) 非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容

print(re.findall(r'a(.*?)b',str))#['a', '', 'a']

关于带括号与不带括号的区别

import restring="abcdefg  acbdgef  abcdgfe  cadbgfe"#不带括号regex=re.compile("((/w+)/s+/w+)")print(regex.findall(string))#输出:[('abcdefg  acbdgef', 'abcdefg'), ('abcdgfe  cadbgfe', 'abcdgfe')]regex1=re.compile("(/w+)/s+/w+")print(regex1.findall(string))#输出:['abcdefg', 'abcdgfe']regex2=re.compile("/w+/s+/w+")print(regex2.findall(string))#输出:['abcdefg  acbdgef', 'abcdgfe  cadbgfe']
  • 第一个 regex 中带有2个括号,其输出list 中包含2个 tuple
  • 第二个 regex 中带有1个括号,其输出内容是括号匹配到的内容,而不是整个表达式所匹配到的结果。
  • 第三个 regex 中不带括号,其输出的内容就是整个表达式所匹配到的内容。

实际上这并不是python特有的,这是正则所特有的 , 任何一门高级语言使用正则都满足这个特点:有括号时只能匹配到括号中的内容,没有括号【相当于在最外层增加了一个括号】。在正则里面 "()" 代表的是分组的意思,一个括号代表一个分组,你只能匹配到 "()" 中的内容。

四、re.findall中参数re.S的意义

1.字符串变为(后面多加了2个b)

str = '''aabbab         aabbaa         bb'''

2.参数无re.S,没有把最后一个换行的aab算进来

print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']

3.参数有re.S,不会对/n进行中断

print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa/n         b']

参考

2. python re模块findall()详解

3. Python 正则re模块之findall()详解

总结

到此这篇关于Python正则表达re模块之findall()函数详解的文章就介绍到这了,更多相关Python正则表达re模块findall()内容请搜索wanshiok.com以前的文章或继续浏览下面的相关文章希望大家以后多多支持wanshiok.com!


19个Python
python中Requests请求的安装与常见用法
51自学网,即我要自学网,自学EXCEL、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。
京ICP备13026421号-1