稀疏数据-web数据挖掘实验ppt

时间:2024-05-15 04:10:33
【文件属性】:

文件名称:稀疏数据-web数据挖掘实验ppt

文件大小:14.29MB

文件格式:PPT

更新时间:2024-05-15 04:10:33

数据挖掘实验

稀疏数据 有的时候数据集中含有大量的0值,这个时候用稀疏格式的数据存储更加省空间。 稀疏格式是针对数据信息中某个对象的表示而言,不需要修改ARFF文件的其它部分。例如数据: @data   0, X, 0, Y, "class A"   0, 0, W, 0, "class B" 用稀疏格式表达的话就是 @data   {1 X, 3 Y, 4 "class A"}   {2 W, 4 "class B"} 注意:ARFF数据集最左端的属性列为第0列,因此,1 X表示X为第1列属性值。


网友评论