颜色分类leetcode-dsc-generating-data-hbs-ds-060120:dsc-生成数据-hbs-ds-060120

时间:2024-07-26 16:09:16
【文件属性】:

文件名称:颜色分类leetcode-dsc-generating-data-hbs-ds-060120:dsc-生成数据-hbs-ds-060120

文件大小:94KB

文件格式:ZIP

更新时间:2024-07-26 16:09:16

系统开源

颜色分类leetcode 生成数据 介绍 数据分析通常需要分析师使用某种类型的数据来测试算法的效率/性能。 在这种情况下,重点不是像我们之前看到的那样回答一些分析问题,而是测试一些机器学习假设,例如,比较两种不同的算法,看看哪一种算法的准确性更高。 在这种情况下,分析师通常会处理他们自己生成的合成随机数据。 本实验和接下来的课程将重点介绍一些数据生成技术,您可以稍后使用这些技术来学习新算法,同时又不会过多地沉迷于领域知识。 目标 你将能够 : 确定数据科学家想要生成数据集的原因 为分类问题生成数据集 为回归问题生成数据集 练习数据集 练习数据集允许测试和调试算法并测试其稳健性。 它们还用于理解算法响应模型参数变化的行为,正如我们将在一些 ML 算法中看到的那样。 以下是此类数据集优于现实世界数据集的一些原因: 快速简便的生成 - 节省数据收集时间和精力 可预测的结果 - 对结果有更高的信心 随机化 - 数据集可以重复随机化以检查多种情况下的性能 简单的数据类型——更容易可视化数据和结果 在本课中,我们将介绍一些可以帮助我们生成随机数据集的 Python 函数。 make_blobs()


【文件预览】:
dsc-generating-data-hbs-ds-060120-master
----index.ipynb(68KB)
----.learn(87B)
----CONTRIBUTING.md(2KB)
----LICENSE.md(1KB)
----index_files()
--------index_10_0.png(8KB)
--------index_27_0.png(6KB)
--------index_16_0.png(9KB)
--------index_29_1.png(6KB)
--------index_29_0.png(6KB)
--------index_22_0.png(7KB)
----README.md(7KB)
----.gitignore(64B)

网友评论