为什么要预处理数据?-浙大关于大数据的讲解

时间:2024-05-15 13:25:52
【文件属性】:

文件名称:为什么要预处理数据?-浙大关于大数据的讲解

文件大小:814KB

文件格式:PPT

更新时间:2024-05-15 13:25:52

大数据算法

为什么要预处理数据? 现实世界的数据是“肮脏的” 不完整的:有些感兴趣的属性缺少属性值,或仅包含聚集数据 含噪声的:包含错误或者“孤立点” 不一致的:在编码或者命名上存在差异 没有高质量的数据,就没有高质量的挖掘结果 高质量的决策必须依赖高质量的数据 数据仓库需要对高质量的数据进行一致地集成


网友评论