文件名称:Tratamento_Dados_R_Python:使用R和Python进行数据处理研究
文件大小:1017KB
文件格式:ZIP
更新时间:2024-04-28 05:11:39
JupyterNotebook
Treatment_Data_R_Python 使用R和Python进行数据处理研究 由于数据有问题,必须加以处理: 没有输入限制(非标准格式)的操作系统和数据库, 直接更新数据库(没有完整性的系统), 直接编码的旧系统, 加载过程中的不一致之处: 多种信息来源,非标准 流程变更(系统更新和数据加载) Craft.io错误 运营与分析 在操作中,无法将其单独格式的数据更改为默认值例如:更改计划值的健康计划客户的出生日期。 在分析中,数据没有个人价值,而是集体价值。 必须通过模型的“良好”进行校正: 示例::预测具有某些特征的客户的成本,并且该模型不允许缺失值。 将缺失年龄更改为中位数不会影响操作,也不会在模型中引起偏差。 最常遇到的数据问题: 表里不一 一致性 完整性 一致性 正直 **最终,我们将分类变量替换为时尚变量,将定量变量替换为数据中位数。 R / Graph
【文件预览】:
Tratamento_Dados_R_Python-main
----Python()
--------Tratamento Tempo.ipynb(86KB)
--------Tratamento Churn.ipynb(164KB)
--------datasets()
--------Gr爁icos.ipynb(472KB)
--------Exploração_Dados_Municipios.ipynb(99KB)
----R()
--------Tratamento Tempo.ipynb(87KB)
--------img()
--------Tratamento Churn.ipynb(146KB)
--------Tratamento_Iris.ipynb(28KB)
--------datasets()
--------Gr爁icos.ipynb(509KB)
--------Exploração_Dados_Municipios.ipynb(104KB)
----README.md(4KB)