文件名称:稀疏数据-web数据挖掘实验ppt
文件大小:14.29MB
文件格式:PPT
更新时间:2024-05-15 04:10:33
数据挖掘实验
稀疏数据 有的时候数据集中含有大量的0值,这个时候用稀疏格式的数据存储更加省空间。 稀疏格式是针对数据信息中某个对象的表示而言,不需要修改ARFF文件的其它部分。例如数据: @data 0, X, 0, Y, "class A" 0, 0, W, 0, "class B" 用稀疏格式表达的话就是 @data {1 X, 3 Y, 4 "class A"} {2 W, 4 "class B"} 注意:ARFF数据集最左端的属性列为第0列,因此,1 X表示X为第1列属性值。