文件名称:speachless:敏感词检测, input text filter, sensitive words
文件大小:10KB
文件格式:ZIP
更新时间:2024-05-29 20:02:40
python text-filter china-law Python
敏感词过滤 python3 测试过滤效果 python -m speachless.test 输出json文件 至 dist python -m speachless.sensitive_tree 简介 speachless/lib 敏感词库, 三个种类,涉政, 色情, 自定义. speachless/sensitive_tree.SensitiveTree 根据词库中的敏感词构造检测tree speachless/sensitive_filter.SensitiveFilter 检测输入内容是否与敏感词匹配 使用 git archive master | tar -x -C /project/xxx/speachless ** 应该将以下对象 作为全局变量避免每次重新初始化 tree 造成额外开销 ** ** 当导入外部词库时, 应避免词库中存在特殊字符** sensit