文件名称:TextFilter:敏感词过滤系统
文件大小:1.84MB
文件格式:ZIP
更新时间:2024-03-31 09:36:19
系统开源
敏感词过滤系统 更多详见 Ubuntu Linux下环境构建: sudo apt-get install python-pip pip install nltk pip install jieba pip install pymongo Config下config文件: 可以进行服务器配置,针对数据库中预定集合的不同区段列, 可以选择语言(中文,英文), 可以设置要过滤的文章数量,时间替换从最近前推 添加邮件通知系统,SendMailFlag =“是”#“否” 结果:细分filter_status为1表示通过过滤,为0表示不通过过滤 stopwords_chs和stopwords_eng为过滤词黑名单 可以随时添加要过滤的单词,一行一个 如果添加的过滤词无法正确被jieba分词,则同样方法将需要过滤的词和词频加入到主字典dict文件中或者用户字典user_dict,一行一
【文件预览】:
TextFilter-master
----SendMail.py(3KB)
----敏感词库大全.txt(9KB)
----TextFilter.py(9KB)
----README.md(1KB)
----TextFliter.bat(27B)
----Config()
--------config(448B)
--------dict(4.84MB)
--------stopwords_chs(12KB)
--------stopwords_eng(10B)
--------user_dict(0B)