《机器学习实践》程序清单2-2

时间:2021-11-08 21:11:17

将文本记录转换为NumPy的解析程序

def file2matrix(filename):
    print("读入文件" + str(filename))

    #以下两行为打开文本文件并读取内容到数组,有没有发现这个操作好简单?!
    fr = open(filename)
    arrayOLines = fr.readlines() #把文件中的文本转为数组

    numberOfLines = len(arrayOLines)#得到文件行数
    returnMat = zeros((numberOfLines,3)) #创建返回的Numpy矩阵,1000行所有值均为0的
    #print(returnMat)
    classLabelVector = []
    index = 0
    for line in arrayOLines:
        line = line.strip()
        listFromLine = line.split('\t') 
        print(listFromLine)

        #访问矩阵中的元素的方法
        #returnMat[1,0:3],3个数字依次表示第1行,从第0列开始,到第2列
        #returnMat[1,0:],2个数字依次表示第1行,从第0列开始,到第最后一列
        #returnMat[1,:],1个数字依次表示第1行,从第0列开始,到第最后一列,即全部列
        #returnMat[2,:3],1个数字依次表示第2行,从第0列开始,到第2列
        returnMat[index,0:] = listFromLine[0:3]
        
        classLabelVector.append(int(listFromLine[-1]))
        index += 1
    #print(returnMat[1,0:4])
    return returnMat,classLabelVector