文件名称:使用不同数据挖掘分类技术的二元类和多类分类器的比较-研究论文
文件大小:364KB
文件格式:PDF
更新时间:2024-06-29 09:19:08
Data Mining Binary
数据挖掘 (DM) 是从庞大的数据集中检索信息并将其转换为有意义的决策的过程。 分类技术被认为是最重要的数据挖掘技术,因为它成为精确有效地描述数据以进行知识发现的学者们的一个令人着迷的话题。 它用于描述和区分数据类或概念。 分类问题有两大类:二元类和多类。 在二元类分类中,给定的数据集分为两类,而在多类分类中,给定的数据集根据分类规则分为几个类。 本文探讨了几种 DM 分类方法,例如决策树,如分类回归树 (CART) 和条件推理树 (CTREE)、随机森林 (RF)、支持向量机 (SVM) 和 k-最近邻 (KNN) 以增强使用强大的大数据挖掘分析工具 R 和 RStudio 的二元类和多类分类器的结果。 使用准确度、F 分数、灵敏度等各种度量来评估分类器的性能,并预测当使用多个分区 (%) 分析训练-测试数据集时哪个分类器的性能更好。