4.3 正则表达式

作者: BeautifulSoulpy | 来源:发表于2019-07-01 22:11 被阅读3次

Regular Expression,正则表达式,简写为RegExp。

BRE :Basic RegExp,基本正则表达式
ERE :Extend RegExp,扩展正则表达式
PCRE :Perl Compatible RegExp,Perl兼容的正则表达式

1. 基本正则表达式

1.1 字符匹配

  • . 匹配任意单个字符:如r..t
  • [] 匹配指定范围内的任意单个字符:如[abc]r
  • [^] 匹配指定范围外的任意单个字符:如[^abc]r
  • [:alnum:] 字母和数字
  • [:alpha:] 代表任何英文大小写字符,亦即 A-Z, a-z
  • [:lower:] 小写字母
  • [:upper:] 大写字母
  • [:blank:] 空白字符(空格和制表符)
  • [:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)
  • [:cntrl:] 不可打印的控制字符(退格、删除、警铃…)
  • [:digit:] 十进制数字 [:xdigit:]十六进制数字
  • [:graph:] 可打印的非空白字符
  • [:print:] 可打印字符
  • [:punct:] 标点符号

1.2 匹配次数

 * 匹配前面的字符任意次,包括0次(贪婪模式,尽可能长的匹配)
 .* 任意长度的任意字符
 \? 匹配其前面的字符0或1次
 \+ 匹配前面的字符1次或多次
 \{n\} 匹配前面的字符n次
 \{m,n\} 匹配前面的字符至少m次,至多n次
 \{,n\} 匹配前面的字符至多n次
 \{n,\} 匹配前面的字符至少n次

1.3 位置锚定

位置锚定:定位出现的位置

^ 行首锚定,用于模式的最左侧(要跟字符匹配里的[^]区分开,那个是在中括号里面的)
$ 行尾锚定,用于模式的最右侧
^PATTERN$ 用于模式匹配整行
^$ 空行
^[[:space:]]*$ 空白行
\< 或 \b 词首锚定,写在单词模式的左侧
\> 或 \b 词尾锚定;写在单词模式的右侧
\<PATTERN\> 匹配整个单词

eg:
# 查找空白字符行/没有空白字符,真空;
[dell@Centos7 ~]$ grep "^$" /etc/fstab

[dell@Centos7 ~]$ 
#查找包含空白字符行;
[dell@Centos7 ~]$ grep "^[[:space:]]*$" /etc/passwd | wc -l
2

2. 分组

分组:()将一个或多个字符捆绑在一起,当作一个整体进 行处理,如:(root)+

分组括号中的模式匹配到的内容会被正则表达式引擎记录于 内部的变量中,这些变量的命名方式为: \1, \2, \3, …
\1 表示从左侧起第一个左括号以及与之匹配右括号之间的 模式所匹配到的字符

示例:
(string1+(string2))
\1 :string1+(string2)

\2 :string2

后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身

grep "\(root\).*\1" /etc/passwd

或者

|

示例:
a|b: a或b
C|cat: C或cat
(C|c)at:Cat或cat

3. 拓展正则表达式

egrep == grep -E

egrep其实很简单,就是把grep里的斜线去掉了,不过有些还没有去掉。

字符匹配:

  • . 任意单个字符
  • [] 指定范围的字符
  • [^] 不在指定范围的字符

次数匹配:

  • *:匹配前面字符任意次
  • ?:0或1次
  • +:1次或多次
  • {m}:匹配m次
  • {m,n}:至少m,至多n次

位置锚定:

  • ^:行首
  • $:行尾
  • <, \b :语首
  • >, \b :语尾

分组:

  • ()
  • 后向引用:\1, \2, …

或者:

|

示例:

  • a|b: a或b
  • C|cat: C或cat
  • (C|c)at:Cat或cat

相关文章

网友评论

    本文标题:4.3 正则表达式

    本文链接:https://www.haomeiwen.com/subject/vpcocctx.html