文件名称:大数据核心技术-ga 374-2019 电子防盗锁(17)
文件大小:2.09MB
文件格式:PDF
更新时间:2024-07-12 18:16:07
10
第5章 大数据可视化的关键技术 of 4518 Ø数据清理技术包括数据不一致性检测技术、脏数据识别技术、数据过滤技术、 数据修正技术、数据噪声的识别与平滑技术等。 Ø数据集成把来自多哥数据源的数据进行集成,缩短数据之间的物理距离,形成 一个集中统一的(同构/异构)数据库、数据立方体、数据宽表与文件等。 Ø数据归约技术可以在不损害挖掘结果准确性的前提下,降低数据集的规模,得 到简化的数据集。归约策略与技术包括维归约技术、数值归约技术、数据抽样技 术等。 Ø经过数据转换处理后,数据被变换或统一。数据转换不仅简化处理与分析过程、 提升时效性,也使得分析挖掘的模式更容易被理解。数据转换处理技术包括基于 规则或元数据的转换技术、基于模型和学习的转换技术等。 5.2大数据核心技术