文件名称:Naive-Bayes-classifier:朴素贝叶斯分类器是分类算法。 它使用基于朴素的伯努利和多项式方程将文档(文本)分类为火腿或垃圾邮件
文件大小:1.55MB
文件格式:ZIP
更新时间:2024-06-15 17:31:05
java algorithm eclipse corpus naive-bayes-classifier
朴素贝叶斯分类器 朴素贝叶斯分类器是分类算法。 它使用基于朴素的伯努利和多项式方程将文档(文本)分类为垃圾邮件或垃圾邮件。 当前,算法仅分类为两个类别,但是可以对其进行修改以将文本分类为N个类别。 项目结构/ jars可执行jar,如果您不想运行源代码/ src /朴素贝叶斯分类器的主要源代码/ src / corpus包含所有数据文件,训练文件和测试文件,停用词文件列表 您可以通过在Eclipse中导入项目或在基于Java的环境中使用cmd / termianl来运行项目 使用Eclipse 在eclipse中导入项目(使用“现有项目到工作区”选项) 运行Train.java(主类)以使用corpus_root_path作为运行时参数来训练您的语料库 运行Train.java退房Bernouli.out和Multinomail.out文件在corpus_root_path后。 这些