文件名称:k-means聚类算法及matlab代码-Data-mining:数据挖掘
文件大小:789KB
文件格式:ZIP
更新时间:2024-06-10 08:43:07
系统开源
k-means聚类算法及matlab代码 数据挖掘实验 实验一:相似度、距离、最近邻分类器 1、实验目的 (1)理解相似度、距离的度量方式。 (2)理解最近邻分类器的工作原理。 2、实验内容 (1)、实现任意给定两个相同维度的向量之间的欧氏距离计算函数 function dist = dist_E(x,y) (2)、实现任意给定两个相同维度的向量之间的夹角余弦相似度计算函数 function sim = sim_COS(X,Y) (3)、实现K最近邻算法 KNN算法思想 输入参数:k值、trainingSamples(训练数据集,MN矩阵,M为样本数,N为属性 数)、trainingLabels(训练数据集的分类标签0、1、2...,M1矩阵), testingSample (测试数据,1*N矩阵) 输出参数:class(测试数据对应类别标签) 算法流程: 得到训练数据集trainingSamples的大小M,N 初始化Distance数组(M*1),用来存储每个训练样本与测试样本的距离。 对每一个训练样本trainingSamples(i,:)【for i=1:M】,计算其与测试样本
【文件预览】:
Data-mining-master
----实验1()
--------normalize.m(287B)
--------sim_COS.m(186B)
--------testingData.mat(4KB)
--------实验1-相似度、距离、最近邻分类器.docx(26KB)
--------trainingData.mat(8KB)
--------KNN_Classify_E.m(866B)
--------dist_E.m(217B)
----实验3()
--------GetParams4ContiAttr.m(171B)
--------实验3-分类器性能度量.docx(461KB)
--------bys_Classify.m(314B)
--------NaiveBayesTrain.m(554B)
--------roc_plot.m(846B)
--------testingData.mat(4KB)
--------trainingData.mat(8KB)
--------NaiveBayesPrdeict.m(476B)
--------roc_plot2.m(855B)
----实验2()
--------bys_Classify.m(700B)
--------NaiveBayesTrain.m(918B)
--------实验2-朴素贝叶斯分类器.docx(227KB)
--------testingData.mat(4KB)
--------trainingData.mat(8KB)
--------NaiveBayesTrain2.m(1KB)
--------GetParams4CategoricalAttr.m(304B)
--------NaiveBayesPrdeict.m(715B)
----README.md(4KB)
----实验4()
--------实验4.doc(113KB)
--------K_MeansMt.m(2KB)
--------data.mat(5KB)