美文网首页Web Scraper
2.2 链接选择器(Link seclector)--websc

2.2 链接选择器(Link seclector)--websc

作者: niujw | 来源:发表于2019-12-02 14:42 被阅读0次

例子:B站新番榜单

今天抓取新番榜单的动画名称和动画名称后的链接url


B站新番榜单

通用步骤

1. 打开插件
2. 创建sitemap
3. 选择合适的选择器(selector)
4. 爬取数据
5. 下载CSV数据

详解

这里上面5个步骤和前面一小节的步骤相同,只有第3步选择选择器不同,我们只选关键的第3步来讲解一下,抓取不同的网站或内容时 选择合适的选择器为关键点,具体网站具体分析。

1 打开软件

略过

2 创建sitemap

略过

3 选择合适的选择器(selector)

这里我们仍选择的是 B站新番榜单

  • 创建sitemap完成后点击 add new selector
    增加selector
  • 选择selector

1:填写selector的名称
2:因为要抓取的是名称和url 所以type选择Link选择器
3: 点击select然后选中 4,5, 6的文本,然后你发现下面的文本也被自动选中了 点击 7 Done selecting! 我们就选中了我们所需要的数据区域
8: 选中Muliple 因为我们需要是多条数据,如果不选仅仅只有一行数据
9: 选中我们的父级selector,_root 是sitemap建立后初始化的根selector,我们创建的选择器都是在_root下的子选择器
10: 保存

11

4 爬取数据

略过

5 下载数据查看数据格式

以下就是我们抓取的数据了 后面title_link-href 就是标题的链接了


5

相关文章

  • 2.2 链接选择器(Link seclector)--websc

    例子:B站新番榜单 今天抓取新番榜单的动画名称和动画名称后的链接url 通用步骤 1. 打开插件 2. 创建sit...

  • 2.1 文本选择器(Text seclector)--websc

    例子:B站新番榜单 还记得我们在前面小节中总结的使用步骤吗?核心点是选对selector 步骤 1 打开插件 2 ...

  • CSS伪类选择器总结

    CSS伪类选择器总结 动态伪类选择器:link, 链接伪类选择器,超链接未被访问前:visited, 链接伪类选择...

  • 精通CSS高级Web标准解决方案读书笔记-02为样式找到应用目标

    常用选择器(类型选择器,后代选择器)p #id .class 伪类链接伪类:link :visited 动态伪类:...

  • CSS:hover选择器

    :link选择器设置指向未被访问页面的链接的样式:visited 选择器用于设置指向已被访问的页面的链接:acti...

  • 2018-11-19

    后代选择器后代选择器可以根据标签的关系,为处在 元素内部的代元素设置样式。给链接定义样式1,正常链接a:link,...

  • css3选择器

    伪类选择器 :link 选择所有未访问的链接 :visited 选择所有已被访问的链接 :active 选择活动链...

  • 伪类选择器

    伪类选择器就是一种状态选择器 “:”link 链接visited 鼠标有点过的hover 鼠标放上去active ...

  • css深入学习笔记

    伪类选择器 a:visited { color : red } 指示作为已访问地址超链接的所有锚 a:link {...

  • Css伪类选择器

    css伪类选择器: 静态伪类 只能用于超链接的样式:link 用于未被访问的链接:visited 用于已访问的链接...

网友评论

    本文标题:2.2 链接选择器(Link seclector)--websc

    本文链接:https://www.haomeiwen.com/subject/tphgwctx.html