文件名称:基于matlab的svm的留一法代码实现-spam_classifier:在Octave中使用SVM的垃圾邮件分类器
文件大小:591KB
文件格式:ZIP
更新时间:2024-06-16 02:40:30
系统开源
基于matlab的svm的留一法代码实现使用SVM的垃圾邮件分类器 小型垃圾邮件分类器,用于将给定的输入电子邮件分类为SPAM / NOT-SPAM。 用于构建分类器。 培训集(spamTrain.mat)包含4000个垃圾邮件和非垃圾邮件电子邮件的培训示例,而测试集(spamTest.mat)包含1000个测试示例。 该分类器达到约99.8%的训练准确度和约98.5%的测试准确度。 数据集基于的子集。 在学习“支持向量机”一章的同时,该项目是Coursera的一部分。 运行项目 确保已安装Octave / MATLAB 将项目克隆到本地计算机,然后在您最喜欢的支持Octave / MATLAB代码的IDE之一中将其打开 运行spam_classifier.m 首先对SVM进行培训,然后对项目存储库中存在的数据集进行测试 显示了该算法认为是垃圾邮件的最佳预测词的单词列表 输入包含您要分类为垃圾邮件/非垃圾邮件的电子邮件的文件名 该应用程序首先对电子邮件进行预处理,并向用户显示经过预处理的电子邮件,该电子邮件将作为输入发送到SVM。 预测完成 如果您发现在计算机中部署项目时遇到任何问题,
【文件预览】:
spam_classifier-master
----inputUserFileName.m(155B)
----svmTrain.m(6KB)
----printPreprocessedEmail.m(380B)
----gaussianKernel.m(321B)
----emailFeatures.m(834B)
----spam_classifier.m(2KB)
----getVocabList.m(600B)
----readFile.m(302B)
----pauseProgram.m(91B)
----vocab.txt(20KB)
----svmPredict.m(2KB)
----linearKernel.m(219B)
----processEmail.m(2KB)
----examples()
--------spamSample.txt(655B)
--------normalmail.txt(2KB)
----spamTest.mat(110KB)
----porterStemmer.m(10KB)
----gaussian_kernel.png(43KB)
----cleanup.m(96B)
----README.md(8KB)
----spamTrain.mat(419KB)