文件名称:慢性肾脏病数据测试
文件大小:10KB
文件格式:ZIP
更新时间:2024-03-09 20:42:29
Python
该项目基于伯克利(Data8.org)开发的数据科学课程的示例和数据集。 这段代码是由梅根·侯申(Megan Houchin)创建的 NearestNeighborClassification:此程序使用K最近邻居分类来确定新的随机数据点是否更有可能对慢性肾脏病(CKD)进行阳性或阴性检验。 该程序首先对ckd.csv文件给出的已知数据进行归一化,因此它们可以是无单位值,并且由于它们共享相同的0-1比例,因此可以彼此直接作图。 然后,在血红蛋白与葡萄糖图上绘制已知数据点,每个轴的范围为0-1。 创建一个随机测试用例,并根据图中最接近的值将其确定为CKD正或负。 使用K最近邻分类法,此预测变得更加准确,因为只要所测试的案例是奇数(避免联系),就可以使用一个以上的案例。 在main中调用graphTestCase时可以调整此数字(当前数字为5)。 K均值聚类:此程序使用K均值聚类在一组数据
【文件预览】:
Chronic-Kidney-Disease-Data-Test-master
----ckd.csv(2KB)
----KMeansClustering_functions.py(9KB)
----__pycache__()
--------KMeansClustering_functions.cpython-37.pyc(4KB)
----KMeansClustering_driver.py(702B)
----NearestNeighborClassification.py(6KB)
----README.md(3KB)