【文件属性】:
文件名称:第三讲 数据预处理
文件大小:3.44MB
文件格式:PDF
更新时间:2021-10-08 09:12:52
数据预处理
数据 预处理
普林大数据学院
普
林
大
数
据
学
院
P
R
I
N
C
E
T
E
C
H
S
B
I
G
D
A
T
A
C
O
L
L
E
G
E
2
目录
第一部分 数据概述
第二部分 数据预处理
第三部分 案例分析和总结
普林大数据学院
普
林
大
数
据
学
院
P
R
I
N
C
E
T
E
C
H
S
B
I
G
D
A
T
A
C
O
L
L
E
G
E
数 据概述
l 数据类型
l 数据对象
l 数据的基本统计信息
l 相似性和不相似性度量
普
林
大
数
据
学
院
P
R
I
N
C
E
T
E
C
H
S
B
I
G
D
A
T
A
C
O
L
L
E
G
E
普林大数据学院
4
普
林
大
数
据
学
院
P
R
I
N
C
E
T
E
C
H
S
B
I
G
D
A
T
A
C
O
L
L
E
G
E
普林大数据学院
l 表格数据
• 关系记录
• 数据矩阵
• 向量
• 事物数据
l 图和网络
• 万维网
• 社交网络
• 分子结构