Regular Expression,正则表达式,简写为RegExp。
BRE :Basic RegExp,基本正则表达式
ERE :Extend RegExp,扩展正则表达式
PCRE :Perl Compatible RegExp,Perl兼容的正则表达式
1. 基本正则表达式
1.1 字符匹配
.
匹配任意单个字符:如r..t
[]
匹配指定范围内的任意单个字符:如[abc]r
[^]
匹配指定范围外的任意单个字符:如[^abc]r
[:alnum:]
字母和数字[:alpha:]
代表任何英文大小写字符,亦即A-Z, a-z
[:lower:]
小写字母[:upper:]
大写字母[:blank:]
空白字符(空格和制表符)[:space:]
水平和垂直的空白字符(比[:blank:]包含的范围广)[:cntrl:]
不可打印的控制字符(退格、删除、警铃…)[:digit:]
十进制数字 [:xdigit:]十六进制数字[:graph:]
可打印的非空白字符[:print:]
可打印字符[:punct:]
标点符号
1.2 匹配次数
* 匹配前面的字符任意次,包括0次(贪婪模式,尽可能长的匹配)
.* 任意长度的任意字符
\? 匹配其前面的字符0或1次
\+ 匹配前面的字符1次或多次
\{n\} 匹配前面的字符n次
\{m,n\} 匹配前面的字符至少m次,至多n次
\{,n\} 匹配前面的字符至多n次
\{n,\} 匹配前面的字符至少n次
1.3 位置锚定
位置锚定:定位出现的位置
^ 行首锚定,用于模式的最左侧(要跟字符匹配里的[^]区分开,那个是在中括号里面的)
$ 行尾锚定,用于模式的最右侧
^PATTERN$ 用于模式匹配整行
^$ 空行
^[[:space:]]*$ 空白行
\< 或 \b 词首锚定,写在单词模式的左侧
\> 或 \b 词尾锚定;写在单词模式的右侧
\<PATTERN\> 匹配整个单词
eg:
# 查找空白字符行/没有空白字符,真空;
[dell@Centos7 ~]$ grep "^$" /etc/fstab
[dell@Centos7 ~]$
#查找包含空白字符行;
[dell@Centos7 ~]$ grep "^[[:space:]]*$" /etc/passwd | wc -l
2
2. 分组
分组:()将一个或多个字符捆绑在一起,当作一个整体进 行处理,如:(root)+
分组括号中的模式匹配到的内容会被正则表达式引擎记录于 内部的变量中,这些变量的命名方式为: \1, \2, \3, …
\1 表示从左侧起第一个左括号以及与之匹配右括号之间的 模式所匹配到的字符
示例:
(string1+(string2))
\1 :string1+(string2)
\2 :string2
后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身
grep "\(root\).*\1" /etc/passwd
或者
|
示例:
a|b: a或b
C|cat: C或cat
(C|c)at:Cat或cat
3. 拓展正则表达式
egrep == grep -E
egrep其实很简单,就是把grep里的斜线去掉了,不过有些还没有去掉。
字符匹配:
- . 任意单个字符
- [] 指定范围的字符
- [^] 不在指定范围的字符
次数匹配:
- *:匹配前面字符任意次
- ?:0或1次
- +:1次或多次
- {m}:匹配m次
- {m,n}:至少m,至多n次
位置锚定:
- ^:行首
- $:行尾
- <,
\b
:语首- >,
\b
:语尾
分组:
()
- 后向引用:
\1
,\2
, …
或者:
|
示例:
- a|b: a或b
- C|cat: C或cat
- (C|c)at:Cat或cat
网友评论