
在上一篇文章聊到什么是RSS以及如何正确使用RSS阅读器。虽然提供了部分RSS订阅源,但是千人千面,每个人对信息的需求都是非常个性化的,再加上国内RSS这种尿性,是根本无法丰富RSS订阅源的。比如我要追踪微博上几个大V的动态,这时就头大了。
“自己动手,丰衣足食”,下面提供一种相对来说还不错的办法——定制个人RSS订阅源。
1. 百度搜索并打开Feed43,点击【Create your first feed】.
如果网页打不开,就换谷歌浏览器

2. 如果初次使用会显示如下的服务协议,勾选同意,点击【Continue】.
如果想把自己创建的订阅源都保存到自己的账号,那就点击右上角【Create account】

3. 将网址复制下来,并粘贴到①;②的 Encoding 代表网页编码方式,留空就行;点击【Reload】,然后我们就可以在⑤ 中看到当前网页的源代码了。
如果出现乱码的情况,表示网页编码方式出错,在②中填写【UTF-8】

4. 下面就是一个找规律的小游戏。
以我的简书主页为例,进入页面后,会有文章列表,每一篇文章会对应着结构相同的源码,比如都包含标题、时间、摘要等等。
我们的目的是把文章的源码拿出来,看看有哪些东西是我想要的。但是由于每篇文章结构差不多,所以我们拿其中一篇的源码出来就可以了。
在浏览器打开网页(以火狐浏览器打开我的简书主页为例),按F12,点击①,把鼠标移动到某篇文章合适位置(让选中色尽量覆盖全),点击左键,这时就可以在③看到浏览器帮你自动定位到相关源码,右键复制下来。

5. 将复制下来的源码粘贴到记事本(我这里用了notepad++,都一样)
好了,这一步我们要明确自己想要抓取的数据以及对应源码是什么。比如,文章标题、摘要、发布时间是想要抓取的数据,源码对应如下图。
注意要保证 HTML 语言格式的完整性。HTML 语言在使用时,标记符号总是成对存在的。例如<a></a>、<p></p>等等。所以不要丢掉后面的标记符号。

6. 我们把上面的源码拿出来后就是下图的样子。接着要把源码进行有规则地精简,让它变得通用。
将标题、链接,时间等变化的字段删去用 {%} 代替。源码中有换行的地方均添加{*}
图二中,不变的有class、target,不用动。变的有href(链接)、data-shared-at(时间)


7. 把刚刚改完的代码粘贴到下图位置,点击【Extract】。如果显示OK,那就没问题,否则返回第5步。
图二显示的是我们已经成功抓取了文章的链接、标题、摘要和时间。 {%+数字} 是通用标识符,比如{%1}代表链接,{%2代表标题}等等(划重点)


8. 接下来的就没啥难度了,把相关内容填充完整就可以。
图一不说了,比较好理解。
图二也不难,在上一步我们说到“{%+数字} 是通用标识符”,这里我们就要把对应的通用标识符填进去就行了。比如第一个是标题,对应着{%2},当然你也可以多个标识符组合使用。填写完后,点击【Preview】就可以预览效果(见图三)



9. 复制Feed URL到Newblur即可(上一篇有说到)
① 代表可用的Feed URL;② 可以将默认地址改成有意义的地址,方便使用。


【附加】10. RSS全文输出
以上可以查看文章简介并不能查看全文(需要点击链接跳转)。
全文输出即是直接从文章链接提取内容,并替代rss文章内容显示。
步骤如下:
百度搜索并打开FULL RSS,把feed url粘贴进去,修改 Max items为10,点击【Create Full Text RSS】即可生成全文输出的RSS订阅源。

历史文章:
拒绝成为信息泛滥的牺牲者——如何用RSS提升信息获取效率?
如何免翻墙使用谷歌搜索和Chrome应用商店
【推荐】17个免费无版权图片网站
最强大的神级浏览器扩展:「油猴」使用详解
如何免费下载中国知网文献
网友评论