Data_Mining_Projects:在数据挖掘过程中设计的算法

时间:2024-04-27 11:28:59
【文件属性】:

文件名称:Data_Mining_Projects:在数据挖掘过程中设计的算法

文件大小:1KB

文件格式:ZIP

更新时间:2024-04-27 11:28:59

KNN算法方法 针对数据挖掘课程设计了不同的KNN算法。 我们提供了与患者癌症状况相关的数据集,具有10种不同的特征,并为诊断提供了分类部分。 “ 1”用于诊断疾病,“ 0”反之亦然。 在家庭作业中,我将种子函数用作rng(3)。 在第一部分中,使用了Matlab的fitcknn作为内置函数。 代码步骤如下:a)使用randperm函数对数据集进行混洗,然后将其分为两个组:训练数据和验证数据。 该分区的形式为:火车集为80%,验证集为20%。 b)对于距离测量,使用欧几里得距离。 c)此分配没有交叉验证。 d)为了预测验证类别,从1到100使用了100个不同的knn值。e)通过使用plot函数,我们可以观察到如何通过更改knn值来区分误差值。 f)最佳knn = 41且错误率选择为0.0614 第二部分,我想出了我自己的KNN函数,即Fuzzyknn和最接近的knn。 a)我用欧几里


【文件预览】:
Data_Mining_Projects-main
----README.md(2KB)

网友评论