-
在训练KNN时使用了UCI数据集,里面的数据通常以.data格式存储,在将数据集中的字符串转化为浮点型时出现了以下错误:
could not convert string to float: ‘temp’ -
上网查了写资料,说是因为数据中存在空格,因此没法直接转换。
-
源代码如下:
-
for x in range(len(dataset) - 1): for y in range(6): xx = dataset[x][y].replace(" ","") dataset[x][y] = float(xx) if () < split: (dataset[x]) else: (dataset[x])
-下面是.data文件转为.csv文件的方法:
[1] 下载好.data文件
[2] 用Excel-数据-导入数据,将.data数据导入Excel中,在导入的过程中会弹出窗口,记得选择“所有分隔符号”。
[3] 将表格存为.csv文件,并将编码方式改为utf-8