python正则表达式提取字符串中的书名_使用python正则表达式从字符串中提取名称...

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-24 06:03   21   0

以下是一种使用零宽度lookaround来隔离每个名称的方法:string = "555-1239Moe Szyslak(636) 555-0113Burns, C. Montgomery555 -6542Rev. Timothy Lovejoy555 8904Ned Flanders636-555-3226Simpson, Homer5553642Dr. Julius Hibbert"

result = re.findall(r'(?:(?<=^)|(?<=[^A-Za-z.,]))[A-Za-z.,]+(?: [A-Za-z.,]+)*(?:(?=[^A-Za-z.,])|(?=$))', string)

print(result)

['Moe Szyslak', 'Burns, C. Montgomery', 'Rev. Timothy Lovejoy', 'Ned Flanders',

'Simpson, Homer', 'Dr. Julius Hibbert']

实际匹配的模式是:

^{pr2}$

这表示匹配任何大写或小写字母、点或句点,后跟空格和一个或多个相同字符,零次或多次。在

此外,我们在该模式的左右两侧使用以下环视:(?:(?<=^)|(?<=[^A-Za-z.,]))

Lookbehind and assert either the start of the string, or a non matching character

(?:(?=[^A-Za-z.,])|(?=$))

Lookahead and asser either the end of the string or a non matching character

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP