文件名称:SMS-Spam-Detection:用于检测 SMS 中的垃圾邮件的小型 ML 项目
文件大小:3.57MB
文件格式:ZIP
更新时间:2024-07-27 06:06:27
Python
该项目是以下论文的实现: 这篇论文存在于references/文件夹中。 它是用 Python 编写的。 运行此项目的先决条件是: Python-2.x(使用 2.7.6) Numpy-1.8.x(使用 1.8.2) scikit-learn-0.15.x(使用 0.15.2) 数据集: 使用的数据集是来自 UCI 机器学习存储库的 SMS-Spam 数据集。 该数据集包含 5574 条短信,每条短信的前缀为 ham/spam 标签。 该数据的 100% 存在于 dataset/training-data-full 中。 70% 的数据集作为训练数据存在于 dataset/train/train-data-1 中 30% 的数据集作为测试数据来衡量准确性。 它存在于 dataset/test/test-data-1 实际测试数据已经收集到dataset/test/sms-d
【文件预览】:
SMS-Spam-Detection-master
----report()
--------report.pdf(36KB)
--------report.odt(48KB)
----vectorize_training_data.py(125B)
----Tester.py(844B)
----train_classifier.py(329B)
----process_testing_data.py(158B)
----label_custom_data.py(957B)
----references()
--------ShiraniMehr-SMSSpamDetectionUsingMachineLearningApproach.pdf(98KB)
--------Improving Static SMS Spam Detection by Using New Content-based F.pdf(441KB)
----Trainer.py(479B)
----output()
--------results.txt(3.1MB)
----FeatureModel.py(3KB)
----extract_features.py(114B)
----normal-flow.sh(549B)
----dataset()
--------train()
--------test()
----process_training_data.py(164B)
----XMLMessageExtractor.py(609B)
----README.md(3KB)
----bin_data()
--------.gitignore(71B)
----custom-flow.sh(401B)
----vectorize_testing_data.py(124B)
----.gitignore(29B)
----Preprocessor.py(3KB)
----test_classifier.py(417B)