美文网首页
敏感词过滤

敏感词过滤

作者: 一一道长一一 | 来源:发表于2018-04-27 10:36 被阅读205次

一、原句处理

1.去除原句中的所有空格

2.去除原句子中的所有标点符号,包含全角和半角的

3.将所有的繁体中文替换成简体中文,工具ZHConverter

4.所有的全角数字替换成半角数字,所有的全角字母替换成半角字母,所有的大写字母替换成小写字母

二、使用敏感词库过滤

1.敏感词库中所有空格和标点符号去除,大写字母替换成小写

2.使用HashMap构建敏感词库DFA算法模型,见:https://www.jianshu.com/p/88d0751e1608

3.使用DFA算法进行查找敏感词

4.将有敏感词的句子屏蔽或删除

三、替换敏感词

如果只是想替换句子中的敏感词,可根据情况再一二的步骤中进行删减,以达到可替换的目的,比如不替换标点符号和转换大写等

相关文章

  • 敏感词过滤

    一、原句处理 1.去除原句中的所有空格2.去除原句子中的所有标点符号,包含全角和半角的3.将所有的繁体中文替换成简...

  • go实现敏感词过滤

    敏感词过滤,提前将敏感词设置好,然后每次有新句子都要过滤一遍,若存在敏感词,则用*号代替,代码如下

  • 关于评论功能的总结

    作为前端,相对敏感词,我更应该注意对发布内容过滤,js脚本和html标签如何过滤 敏感词的过滤应当是过滤服务器➕人...

  • iOS 敏感词过滤 (OC与Swift版本都有)

    iOS 敏感词过滤:用*代替敏感词 实现效果举例: 敏感词为 : 123 “哈哈123456哈哈123呵呵” 被转...

  • python实现敏感词过滤的几种方法

    1.replace过滤 最简单也是最直接的就是直接循环敏感词,然后使用replace过滤关键词,文章和敏感词少的时...

  • java过滤敏感词!

    课程设计做了个博客系统,为了对评论进行敏感词过滤,所以去看了下DFA 在Java中实现敏感词过滤的关键就是DFA算...

  • 敏感词过滤问题

    互联网公司通常需要对手机或者社交软件发送的信息进行敏感词过滤,用户发送的信息一般是100多个字,但总量特别大,一周...

  • Java敏感词过滤

  • jS敏感词过滤

    //定义敏感字符 varforbiddenArray=['xx','<','>','黄色']; //定义函数 fu...

  • 敏感词过滤算法

    前言 在游戏设计中一个最基本的功能就是处理屏蔽字、敏感字,至于为什么这个需求这么重要?你懂的。在网上搜了很多资料,...

网友评论

      本文标题:敏感词过滤

      本文链接:https://www.haomeiwen.com/subject/augwzxtx.html