文件名称:Data-Preparation-in-Data-Science-using-R
文件大小:2KB
文件格式:ZIP
更新时间:2024-04-29 08:50:04
数据整理是从多个源读取数据并更改其内容和结构以便可用于分析的过程。 数据准备或数据整理是一个耗费数据科学家最多时间和精力的过程,最多可节省80%的时间。 详细来说,读取源数据最多需要20%,组织和清理数据最多需要60%。 为什么数据整理如此重要? 数据可以被企业进一步利用 减少失去的商机(失去机会) 在系统之间更容易“交谈”,因为它们可以更好地集成 数据整理包括哪些活动? 清理数据 添加数据字段 将两个数据集放在一起 将两个数据集放在一起 取消合并数据列 数据整理未包括以下哪些活动? 维护数据安全 分析十大销售点 为什么我们需要缺失值表示? 这样我们就可以摆脱不相关的数据 这样就可以用其他值填充数据 这样我们就可以区分丢失的数据和不可能的数学运算的结果 不适用(不可用) NA是R中缺失值的主要表示形式,并且是一个原子值。 这意味着NA位置与数字的原子值示例(例如1、2或100)相同。也
【文件预览】:
Data-Preparation-in-Data-Science-using-R-main
----README.md(3KB)