matlab代码影响-Top-10-Data-Mining-Algorithms:排名前10位的数据挖掘算法

时间:2024-06-11 04:08:21
【文件属性】:

文件名称:matlab代码影响-Top-10-Data-Mining-Algorithms:排名前10位的数据挖掘算法

文件大小:12KB

文件格式:ZIP

更新时间:2024-06-11 04:08:21

系统开源

matlab代码影响排名前10位的数据挖掘算法 1.C4.5 它有什么作用? C4.5以决策树的形式构造一个分类器。 为此,为C4.5提供了一组数据,这些数据表示已经分类的事物。 什么是分类器? 分类器是数据挖掘中的工具,它使用一堆数据来表示我们要分类的事物,并尝试预测新数据所属的类。 这是什么例子? 假设数据集包含一堆患者。 我们了解每个患者的各种信息,例如年龄,脉搏,血压,最大摄氧量,家族病史等。这些被称为属性 现在: 考虑到这些属性,我们想预测患者是否会得癌症。 患者可以分为2类中的1类:会得癌症或不会得癌症。 C4.5被告知每个患者的班级。 这是交易: 使用一组患者属性和患者的相应类别,C4.5构造了一个决策树,该决策树可以根据新患者的属性预测新患者的类别。 那么什么是决策树? 决策树学习创建类似于流程图的内容,以对新数据进行分类。 使用相同的患者示例,流程图中的一条特定路径可能是: 患者有癌症病史 患者正在表达与癌症患者高度相关的基因 患者患有肿瘤 患者的肿瘤大小大于5厘米 这是有监督的还是无监督的? 这是有监督的学习,因为训练数据集标有类别。 以患者为例,C4.5不会独自得


【文件预览】:
Top-10-Data-Mining-Algorithms-master
----README.md(34KB)

网友评论