k-means聚类算法及matlab代码-xiyuegushan:广州大学机器学习与数据挖掘实验代码

时间:2024-06-10 08:43:20
【文件属性】:

文件名称:k-means聚类算法及matlab代码-xiyuegushan:广州大学机器学习与数据挖掘实验代码

文件大小:6.88MB

文件格式:ZIP

更新时间:2024-06-10 08:43:20

系统开源

k-means聚类算法及matlab代码 广州大学机器学习与数据挖掘实验代码 实验1 组员信息 1.梁兆豪(组长): TXT数据源读入与数据处理 2.林嘉伟: 数据库数据源读入与数据处理 3.叶建忠: 完成数据计算 作业题目和内容 广州大学某班有同学100人,现要从两个数据源汇总学生数据。第一个数据源在数据库中,第二个数据源在txt文件中,两个数据源课程存在缺失、冗余和不一致性,请用C/C++/Java程序实现对两个数据源的一致性合并以及每个学生样本的数值量化,两个数据源合并后读入内存,并统计: 学生中家乡在Beijing的所有课程的平均成绩。 学生中家乡在广州,课程1在80分以上,且课程9在9分以上的男同学的数量。(备注:该处做了修正,课程10数据为空,更改为课程9) 比较广州和上海两地女生的平均体能测试成绩,哪个地区的更强些? 学习成绩和体能测试成绩,两者的相关性是多少?(九门课的成绩分别与体能成绩计算相关性) 作业环境 jdk11, windows10 x64 难题与解决 初期在数据源的读取中存在一定的问题,在文本数据源读入时出现了数据读入不完整,读入错误的问题,经多次检查后发现


【文件预览】:
xiyuegushan-main
----sigmoid.py(529B)
----Gradient Descent.py(545B)
----Experiment()
--------直方图.PNG(65KB)
--------src()
--------lib()
--------student.txt(6KB)
--------sample.txt(962B)
--------散点图.PNG(57KB)
----README.md(5KB)
----.gitignore(278B)

网友评论