美文网首页爬虫
正则表达式

正则表达式

作者: 郭祺迦 | 来源:发表于2018-09-27 12:31 被阅读0次

为什么引入正则表达式?:正则表达式可查找一类的字符串

正则表达式:

单字符匹配:

 \d匹配所有的数字字符

 \D 匹配除数字字符以外的其他所有的字符

 \s匹配所有的空白字符;比如\t 空格等

 \S 匹配除空白字符以外的其他所有的字符

 \w 匹配数字、字母大小写、下划线和中文

 \W匹配除了\w以外的的字符

 .   除了换行符以外的所有字符

 [ ] 匹配括号中的任意一个

数量装饰

 {5} 装饰前面的一个字符出现五次

 {5,} 装饰前面的一个字符至少出现五次

 {5,8} 装饰前面的一个字符至少5次,最多八次

 {0,} 任意多次  也可以用*表示

 {1,} 至少一次  也可以用+表示

 {0,1}可有可无   也可以用?表示 

延伸:.*:任意装饰   .+:至少一次 

边界修饰

 ^    以XX开头

 $  以XX结尾

分组修饰

():

1>:视为一个整体

2>:子模式

贪婪:

.*?:取消贪婪

.+?:取消贪婪

模式修正

re.I:忽略大小写

pattern = re.compile(r'love',re.I)

string = 'LOVE is a best feel'

ret = pattern.search(string) print(ret.group())

re.S:视为单行模式

string = '''

沁园春-雪 北国风光,千里冰封,

万里雪飘 望长城内外,惟余莽莽

'''

pattern = re.compile(r'

(.*?)',re.S)

ret = pattern.search(string) print(ret.group(1))

re.M:视为多行模式

string = '''

刘德华

love 马德华

love 牛德华

'''

pattern = re.compile(r'^love',re.M)

ret = pattern.search(string) print(ret.group)

查找的三种方法:

re.match():从字符串的开头开始比配,如果匹配成功直接返回,返回一个对象

re.findall():匹配所有,返回一个列表

re.search():从字符串的任意位置开始匹配,如果匹配成功,直接返回

ret.group():整个正则匹配的内容

ret.group(1):第一个子模式匹配的内容

ret.group(2):第二个子模式匹配的内容

ret.findall():如果需要整个正则匹配的内容,需要将整个正则用小括号括起来

正则替换

.sub('替换的值',替换的字段)

相关文章

  • Linux命令行与Shell脚本编程大全-shell正则表达式

    本章内容: 定义正则表达式 了解基本正则表达式 扩展正则表达式 创建正则表达式 定义正则表达式 正则表达式是你定义...

  • 正则相关

    正则表达式基本语法 正则表达式常见字符 正则表达式特殊字符 正则表达式数量词 正则表达式边界匹配 正则表达式逻辑或...

  • 正则表达式系列-1

    正则表达式系列-1正则表达式系列-2正则表达式系列-3正则表达式系列-4 什么是正则表达式 正则表达式就是用事先定...

  • 正则表达式

    正则表达式 - 教程正则表达式 - 简介正则表达式 - 语法正则表达式 - 元字符正则表达式 - 运算符优先级正则...

  • Python基础入门 - 正则表达式与综合实战

    1. 初识正则表达式 1.1 介绍 步骤介绍正则表达式入门及应用正则表达式的进阶正则表达式案例 1.2 正则表达式...

  • Java正则表达式参考

    Java正则表达式入门 java正则表达式应用 深入浅出之正则表达式(一) 深入浅出之正则表达式(二) 正则表达式...

  • 正则表达式

    正则表达式 正则表达式就是记录文本规则的代码 正则表达式常用的元字符 正则表达式常用的限定符 正则表达式举例:这里...

  • Python爬虫(十)_正则表达式

    本篇将介绍python正则表达式,更多内容请参考:【python正则表达式】 什么是正则表达式 正则表达式,又称规...

  • python正则表达式

    本篇将介绍python正则表达式,更多内容请参考:【python正则表达式】 什么是正则表达式 正则表达式,又称规...

  • 正则表达式

    了解正则表达式基本语法 能够使用JavaScript的正则对象 正则表达式简介 什么是正则表达式 正则表达式:用于...

网友评论

    本文标题:正则表达式

    本文链接:https://www.haomeiwen.com/subject/tbheoftx.html