uob-email-spam-filter:贝叶斯垃圾邮件分类器

时间:2024-07-21 13:22:14
【文件属性】:

文件名称:uob-email-spam-filter:贝叶斯垃圾邮件分类器

文件大小:14.55MB

文件格式:ZIP

更新时间:2024-07-21 13:22:14

Java

垃圾邮件过滤器 2012年 使用改进的贝叶斯分类器对电子邮件是否为垃圾邮件进行分类。 还包括一些可选的电子邮件预处理。 分类准确率当然非常依赖于特征选择和训练数据,但我已经使用这个分类器实现了 97% 的正确分类电子邮件。 依赖关系 Java 和 JDK。 海湾合作委员会。 GNU C 库 (glibc)。 编译运行 编译: gcc launch.c -o launch-server javac *.java 使用以下内容对电子邮件进行分类: java filter path/to/email 第一次运行时对电子邮件进行分类需要几秒钟的时间,但是在后续运行中应该会非常快。 可选的预处理 标题剥离。 标题字段提取。 通过正则表达式过滤单词。 按长度(最小和最大)过滤单词。 用正则表达式替换单词。 对/三重词相加(N 克)。 不区分大小写。 客户端/服务器代码 对于我为


网友评论