Java 敏感词过滤,Java 敏感词替换,Java 敏感词工具类

时间:2022-10-12 15:11:24

Java 敏感词过滤,Java 敏感词替换,Java 敏感词工具类

 

===========================

©Copyright 蕃薯耀 2017年9月25日

http://www.cnblogs.com/fanshuyao/

 

一、问题描述

很多对外网站的某些内容都需要过滤敏感词,避免政治与色@情上的问题。

 

二、解决方案

使用词库进行匹配过滤成 * (星号)

 

Java 敏感词工具类及敏感词词库见附件。

 

1、下载后,有几个类,主要为WordFilter 这个工具类,使用方法如下:

Java代码  Java 敏感词过滤,Java 敏感词替换,Java 敏感词工具类
  1. content = WordFilter.doFilter(content);//敏感词过滤  

 就是这么简单。

 

2、配置文件共有2个, 在resources文件夹中,

sensitiveWords.txt :敏感词词库

sensitiveWordsSplitCode.txt :敏感词中间的分隔符

为什么会有分隔符,如很多人通过在敏感词之间增加分隔符或其它字符逃避系统敏感词的过滤,如:

色@情(中间不加@,不让我提交) 写成 色@情,可能有些系统就不能过滤了,而sensitiveWordsSplitCode.txt 就起到这样的作用,就算用别的字符分隔,也能识别出来进行过滤。

 

把这2个配置文件放在src/main/resources下,这个是Maven项目的,JavaWeb项目放在src下。

 

最后,到处结束了

 

下载附件走起吧。

 附件下载地址:http://fanshuyao.iteye.com/blog/2394157

 

===========================

©Copyright 蕃薯耀 2017年9月25日

http://www.cnblogs.com/fanshuyao/