文件名称:matlab导入excel代码-Project1:机器学习与数据挖掘实验
文件大小:1.74MB
文件格式:ZIP
更新时间:2024-06-10 03:08:37
系统开源
matlab导入excel代码 Project1 机器学习与数据挖掘实验文件库 组员信息 李华辉(组长) 冼海俊 实验一 ###分工信息 李华辉:代码的实现部分+文档编写(80%) 冼海俊:代码的规范化+文档编写+作业提交(20%) 作业题目和内容 题目:多源数据集成、清洗和统计 内容:广州大学某班有同学100人,现要从两个数据源汇总学生数据。第一个数据源在数据库中,第二个数据源在txt文件中,两个数据源课程存在缺失、冗余和不一致性, 请用C/C++/Java程序实现对两个数据源的一致性合并以及每个学生样本的数值量化。两个数据源合并后读入内存,并统计: 1、学生中家乡在Beijing的所有课程的平均成绩。 2、学生中家乡在广州,课程1在80分以上,且课程10在9分以上的男同学的数量。 3、比较广州和上海两地女生的平均体能测试成绩,哪个地区的更强些? 4、学习成绩和体能测试成绩,两者的相关性是多少? 作业环境 文件说明:一个python 文件 main.py 函数说明: 自己编写了一个计算相关性的函数 cor(a,b) 调用了计算开根号的函数math.sqrt(),计算列表所有元
【文件预览】:
Project1-main
----Experience3()
--------聚类:3类.png(26KB)
--------exe3.py(5KB)
--------聚类:4类.png(27KB)
--------聚类:2类.png(24KB)
--------机器学习与数据挖掘实验3.docx(162KB)
--------分类.png(24KB)
--------归类结果.png(11KB)
--------聚类:5类.png(26KB)
--------散点图.png(17KB)
--------类中心.png(7KB)
--------teacher_data.txt(220B)
--------README.md(64B)
--------Lee_data.txt(21KB)
----Experience2()
--------运行结果截图6.png(69KB)
--------main.py(4KB)
--------运行结果截图3.png(67KB)
--------form3.png(23KB)
--------form2.png(13KB)
--------运行结果截图2.png(59KB)
--------运行结果截图5.png(67KB)
--------exe2.py(3KB)
--------form1.png(150KB)
--------运行结果截图4.png(69KB)
--------运行结果截图1.png(39KB)
--------机器学习与数据挖掘实验2.docx(571KB)
--------exe1.py(3KB)
--------README.md(37B)
----Files()
--------exe4.py(3KB)
--------exe3(1).py(5KB)
--------main.py(4KB)
--------Lee_data(1).txt(21KB)
--------一.数据源2-逗号间隔.txt(6KB)
--------一.数据源1.xlsx(17KB)
--------Lee_ID.txt(2KB)
--------teacher_data(1).txt(220B)
--------exe2.py(4KB)
--------exe1.py(3KB)
----README.md(9KB)
----Experience4()
--------exe4.py(3KB)
--------可视化模型对(2,6)分类.png(63KB)
--------画出sigmoid函数.png(15KB)
--------可视化模型.png(20KB)
--------Lee_ID.txt(2KB)
--------机器学习与数据挖掘实验4(2KB)
--------实验4.docx(160KB)
----Experience1()
--------main.py(6KB)
--------一.数据源2-逗号间隔(1).txt(6KB)
--------一.数据源1(1).xlsx(17KB)
--------运行结果截图2.png(123KB)
--------实验报告一(1).docx(16KB)
--------运行结果截图1.png(87KB)
--------README.md(16B)