文件名称:文本反垃圾邮件:商用级垃圾文本分类器
文件大小:1.42MB
文件格式:ZIP
更新时间:2024-03-12 20:40:23
antispam tensorlayer Python
产品级垃圾文本分类器 注意事项: 垃圾文本分类器所用到的张量流版本为2.2.0。 tensorlayer请下载最新版本,建议从GitHub源码下载。 任务场景 文本反垃圾是网络社区应用非常常见的任务。因为各种利益关系,网络社区通常都很难避免地会涌入大量骚扰,色情,欺诈骗等垃圾信息,扰乱社区秩序,伤害用户体验。这些信息往往隐晦,多变,传统规则系统或正则表达式表达式匹配关键字难以应对。通常情况下,文本反垃圾离不开用户行为分析,本章只针对文本内容部分进行讨论。 为了躲避平台监测,垃圾文本常常会使用火星文等方式对关键字进行隐藏。 渴望 兂 极限 激情 恠 燃烧 加 涐 嶶 信 lovexxxx521 亲爱 的 看 頭潒 约 私人 企鹅 ⓧⓧⓧ㊆㊆⑧⑧⑧ 给 你 爽 你 懂 的 垃圾文本通常将会备有多个联系方式进行用户引导流。识别异常联系方式是反垃圾的一项重要工作,但是传统的识别方法依赖大量策略,
【文件预览】:
text-antispam-master
----.gitignore(1KB)
----images()
--------9-NBOW_and_MLP_Classifier-color.png(32KB)
--------5-Loss_and_Accuracy-color.png(38KB)
--------8-From_Client_to_Server-color.png(28KB)
--------7-gRPC-color.png(31KB)
--------10-CNN_Classifier-color.png(41KB)
--------2-Word2vec-color.png(79KB)
--------1-Word2vec_and_Dynamic_RNN-color.png(50KB)
--------4-Lookup_Table-color.png(15KB)
--------3-Dynamic_RNN-color.png(48KB)
--------6-Antispam_Service_Architecture-color.png(56KB)
----serving()
--------serving_rnn.py(3KB)
--------serving_mlp.py(2KB)
--------packages()
--------README.md(10KB)
--------serving_cnn.py(3KB)
----LICENSE(1KB)
----network()
--------rnn_classifier.py(20KB)
--------mlp_classifier.py(17KB)
--------README.md(21KB)
--------cnn_classifier.py(17KB)
----README.md(8KB)
----word2vec()
--------data()
--------word2vec.py(7KB)
--------text2vec.py(1KB)
--------text_features.py(1KB)
--------README.md(12KB)