C++ DFA实现敏感词匹配

时间:2023-12-29 03:27:59
【文件属性】:

文件名称:C++ DFA实现敏感词匹配

文件大小:3.47MB

文件格式:ZIP

更新时间:2023-12-29 03:27:59

c++ dfa算法

该算法基于DFA并进行相应的简化,大概流程是将敏感词库按模块聚合构建成一个词树,然后从头到尾扫描一遍目标文本,当遇到以敏感词树中的索引的字时,查看后面的文本是否构成敏感词,构成敏感词即记录(当查找到敏感词时,记录下来敏感词位置,接着往下匹配,如果后续匹配不上,则以之前匹配到的为主,如若后续匹配上了,则将之前匹配到的节点后移,以此匹配到最长的敏感词) 该DEMO已实现添加敏感词 设置敏感词的等级 敏感词低于何种等级不屏蔽 实现了最长的敏感词匹配(即敏感词为:中国,中国人,中国人民 )当输入:我是一个中国人民时,匹配到中国人民


【文件预览】:
DFADemo
----DFADemo.sdf(8.81MB)
----DFADemo.v12.suo(32KB)
----Debug()
--------DFADemo.ilk(543KB)
--------DFADemo.exe(132KB)
--------DFADemo.pdb(1.14MB)
----DFADemo()
--------DFADemo.vcxproj.filters(1KB)
--------DFADemo.vcxproj(4KB)
--------Դ.cpp(603B)
--------TrieNode.h(1KB)
--------Filter.cpp(6KB)
--------Debug()
--------Filter.h(437B)
--------TrieNode.cpp(928B)
----DFADemo.sln(967B)

网友评论