python 正则表达式

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-24 06:03   77   0

1、search (正则匹配字符串,返回第一次匹配到的位置信息)

2、findall (返回查到的数据,不会返回位置信息)


先引用re模块:

import re

1)、查询指定字符串:

re.search(r'fish', 'i like fish,hhhhhhh) #返回字符串位置和要查询的字符串:span=(3, 4), match='2'

2)、查询通配符(python中的通配符是“.”,匹配除了换行符之外的所有字符)

re.search(r'.', 'i like fish,hhhhhhh ) #返回第一个字符的位置和字符:span=(0, 1), match='i'

取消“.”的通配符特性,加'\'

re.search(r'\.', 'i like fish,hhhhhhh ) #返回'.'的位置

re.search(r'[.]', 'i like fish,hhhhhhh ) #采用字符类[],将"."当成一个普通字符串来处理

3)、匹配数字

re.search(r'\d\d\d', 'i like 123 fish,hhhhhhh ) #几个\d就是匹配几个连续的数字,\d个数多于字符串中数

字个数时,匹配不到

4)、字符类,几个字符中,匹配到任意一个,即匹配成功
(字符类:将中括号中的数据当成一个普通的字符串来处理,除了个别特殊情况)

re.search(r'[aeiou]', 'i like 123 fish,hhhhhhh) #匹配到aeiou中的任意一个即可,返回字符串中匹配到的第一

个字符的位置,和字符

re.search(r'[0-9]' , 'i like 123 fish,hhhhhhh ) #匹配0-9数字中的任意一个,

正则表达式匹配的是字符串,数字对于字符串只有0-9组成;9以上的,表示两个或更多个字符

举例:re.search(r'[0-255]','236') #匹配的是0-2、5,即匹配0,、1、2、5几个钟的任意一个

多次匹配: re.search(r'ab{2,10}c', 'abbbbbbbbbc') #匹配有2-10个b的abc

5)、匹配 ip地址

1、re.search(r'[01]\d\d|2[0-4]\d|25[0-5]','136')

#雏形,匹配一个指定范围内的数字

#解析:1、[01]\d\d:第一位数字是0或1的三位数

2、 2[0-4]\d :第一位数字是2,第二位是0、1、2、3、4的三位数

3、25[0-5]:第一位是2,第二位是5,第三位是0、1、2、3、4、5的三位数

查询一个三位数是1 或 2 或 3三种情况中的任意一种


2、re.search(r'(([01]{0,1}\d{0,1}\d|2[0-4]\d|25[0-5])\.){3}([01]{0,1}\d{0,1}\d|2[0-4]\d|25[0-5])','192.186.1.1')

#用于匹配ip地址中ip段是一位数的IP,例如:192.186.1.1,

#[01]{0,1} \d{0,1} :表示第一位第二位数字出现次数可以是0次或1次,避免了1位数匹配不到的情况

#{3} :重复三次

升级版:(search

re.search(r'(([01]?\d?\d|2[0-4]\d|25[0-5])\.){3}([01]?\d?\d|2[0-4]\d|25[0-5])','192.186.1.1')

# ? : 表示重复0次或者1次

升级版:findall

re.search(r'(?:(?:[01]?\d?\d|2[0-4]\d|25[0-5])\.){3}(?:[01]?\d?\d|2[0-4]\d|25[0-5])','192.186.1.1')

# ?: :取消元祖获取数据


6 )、元字符( . ^ $ * + ? { } ( ) [ ] | \ )
1、| (或)
re.search(r"fish(c|d)","like fishc")

2、^ (以XX开头)
re.search(r"^fish", "fishc.com")
re.search(r"[^a-z]", "fishc.com") #返回除了a-z的字符,取反
re.search(r"[a-z^]", "fishc.com") #返回在a-z范围内的字符
3、$ (以XX结尾)
re.search(r"fish$"," i like fish")

4、{ }
re.search(r"fish(3)"," i like fishfishfish") #匹配fishfishfish
re.search(r"fish(1,3)"," i like fishfish") #匹配fish1到3个就可以
5、 * + ?
*:匹配前面的表达式0或多次
+:匹配前面的表达式1或多次
?: 匹配前面的表达式0或1次
可与“.”合用,
在最后加上“?”,可以只找第一个

模式方法:

p = re.compile(r"[a-z]")

p.search("i like fish")


正则表达式忽略空格:

p = re.compile(r"[a-z] [0-9]", re.VERBOSE)

p.search("I like li8")






分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP