文件名称:ml-垃圾邮件分类
文件大小:10KB
文件格式:ZIP
更新时间:2024-02-28 23:10:40
Python
如何开始: 克隆此存储库并输入。 python -m venv venv source venv/bin/activate pip install -r requirements.txt 如何训练模型: 使用以下布局将您喜欢的数据集放置在data目录中: 目录布局: data/ dataset_name/ ham/ #在此处放置火腿/干净的邮件样本。 spam/ #将垃圾邮件样本放在此处。 邮件可以分为多个子目录(例如,“ data / dataset_name / spam / abc / 1234 / message1”) 所有消息都必须是RAW电子邮件(带有标题和正确的编码)。 类似于Maildir的邮箱项目应开箱即用。 推荐的数据集: 安然RAW数据集: : Spamassassin公共语料库数据集: : 运行python datasets.py -
【文件预览】:
ml-spam-classification-master
----settings.py(78B)
----train.py(7KB)
----utils.py(2KB)
----datasets.py(7KB)
----requirements.txt(215B)
----classifier.py(2KB)
----models.py(816B)
----README.md(2KB)
----data()
--------.placeholder(0B)
----.gitignore(63B)