正则表达式01

作者: whong736 | 来源:发表于2018-01-28 21:51 被阅读17次

/W 匹配非特殊字符 即字母 数字下划线
/d 匹配任意的十进制数
/s 匹配任意空白字符

/W 大写W,匹配小w相反的词,即匹配: 特殊字符
/D 除了任意十进制的

[ ] 原子组

. 匹配任意字符

^ 开始符

结束符

  • 匹配多次

? 匹配 0

  • 匹配1以上

T{ 3} 前面的原子T出现了3次

{n,}刚好出现n次

{n,m}至少出现n次,最多出现m次

| 或选择符,1|2 ,即1或2

( ) 提取一个内容上

作业:

抓取一个漫画网站的排行榜的漫画名


image.png

网址:http://www.pufei.net/shaonianrexue/

打开源码查看规律:


image.png
import re
import urllib.request


data = urllib.request.urlopen("http://www.pufei.net/shaonianrexue/").read()

#对读取的结果进行编码
data= data.decode("gb2312")

#定义正则表达式
pat='class="vtip">(.*?)</a>'

#根据正则表达式,进行匹配得到结果放入到result
result= re.compile(pat).findall(str(data))

#定义一个打开的文件
refile = open("/Users/vincentwen/Downloads/requestfile.txt","w")

#循环写入内容,并换行
for i in range(0,len(result)):
    refile.write(result[i]+"\n")

#关闭打开的文件
refile.close()



image.png
image.png

相关文章

  • Day15 正则表达式

    01.正则表达式的符号 02.正则表达式符号组合 03.正则表达式 04.re 模块方法 01.正则表达式的符号 ...

  • 05_01_egrep及扩展正则表达式05_02_bash脚本编

    05_01_egrep及扩展正则表达式 REGEXP:正则表达式 基本正则表达式:BasicREGEXP grre...

  • day15正则表达式

    01-正则表达式的符号 02-正则表达式符号组合 03-正则表达式 04-re模块方法

  • day15 正则表达式

    01 正则表达式的符号 正则表达式:用来做字符串查找,匹配,切割用的一种工具 python对正则表达式的支持:提供...

  • day17-正则表达式

    01-正则表达式 1、正则表达式就是用来检测字符串是否满足某种规则的工具。2、python对正则表达式的支持,提供...

  • day15-正则表达式

    01-正则表达式的符号 正则表达式:用来做字符串查找、匹配、切割用的一种工具 python对正则表达式的支持:提供...

  • day15

    01 正则表达式 正则表达式:用来做字符串查找、匹配、切割用的一种工具 python对正则表达式的支持:提供了re...

  • Python-re模块(正则表达式)

    01. 正则表达式基础知识 1.1 原子 原子是正则表达式中最基本的组成单位,每个正则表达式中至少要包含一个原子,...

  • DAY17 regularExpression正则表达式 201

    01-recognize regular expression认识正则表达式 02-main functions ...

  • 正则表达式 01

    正则表达式 01 https://leetcode-cn.com/problems/jewels-and-ston...

网友评论

    本文标题:正则表达式01

    本文链接:https://www.haomeiwen.com/subject/roxaaxtx.html