文件名称:k-means聚类算法及matlab代码-DataMining-Experiment:数据挖掘实验
文件大小:1.11MB
文件格式:ZIP
更新时间:2024-06-10 08:42:45
系统开源
k-means聚类算法及matlab代码 数据挖掘-实验 . 目录 实验内容 实验说明文档 :link: 第三方库 数据处理模块: | 数据可视化模块: | 仓库文件内容说明 文件/目录 说明 实验一 代码 实验二 代码 运行结果 实验三 代码 运行结果 源文件 实验四 代码 运行结果 源文件 实验一 processed data 实验二的归一化数据 实验一 数据资源 实验一 多源数据集成、清洗和统计 题目 : 广州大学某班有同学100人,现要从两个数据源汇总学生数据。第一个数据源在数据库中,第二个数据源在txt文件中,两个数据源课程存在缺失、冗余和不一致性,请用C/C++/Java程序实现对两个数据源的一致性合并以及每个学生样本的数值量化。 :check_mark_button: 两个数据源合并后读入内存,并统计: :check_mark_button: 学生中家乡在Beijing的所有课程的平均成绩。 :check_mark_button: 学生家乡在广州,课程1在80分以上,且课程9在9分以上的男同学的数量。(备注:该处做了修正,课程10数据为空,更改为课程9) :check_mark_button: 比较广州和上海两地女生的平均体能测试成绩,哪个地区的更强些? :check_mark_button: 学习成绩和体能测试成绩,两者的相关性是多少?(九门课的成绩
【文件预览】:
DataMining-Experiment-main
----.gitignore(477B)
----README.md(8KB)
----resources()
--------Exp01()
--------《机器学习与数据挖掘实验》.url(202B)
----DataMining exp 02()
--------02-02 histogram graph.py(843B)
--------02-03 z-score.py(2KB)
--------02-05.py(5KB)
--------02-01 scatter graph.py(297B)
--------02-02.png(12KB)
--------02-04.png(87KB)
--------02-04 Correlation Matrix.py(4KB)
--------02-01.png(14KB)
----.gitattributes(66B)
----DataMining exp 01()
--------01-02_04-question.py(2KB)
--------README.md(2KB)
--------qusetion.py(2KB)
--------genData.py(2KB)
--------01-00 mergeData.py(4KB)
--------getData.py(272B)
----output()
--------Exp01()
--------Exp02()
----DataMining exp 03()
--------README.md(3KB)
--------show.py(363B)
--------kmeans.cpp(7KB)
--------kmeans_01.cpp(6KB)
--------getStuScoreAfterZScore.py(369B)
--------showClusteringResult.py(1KB)
--------output()
--------example_x_y.png(9KB)
--------showWhileCpp.py(1KB)
--------sourceData()
----DataMining exp 04()
--------梯度下降图.png(30KB)
--------sigmoid函数图像.png(16KB)
--------LogisticRegression.py(4KB)
--------data.csv(239B)
--------相关函数()
--------sigmoid函数图像.py(151B)
--------.idea()
--------data.png(12KB)