Numpy库的学习(一)

时间:2022-11-02 22:57:26

今天来学习一下Python库中,支持高级大量的维度数组与矩阵运算的神奇的Numpy库

Numpy同时也对数组运算提供大量的数学函数,对于大量计算运行效率极好

是大量机器学习框架的基础库

废话不多说,直接开整

Numpy中最核心的结构就是ndarray数组

Numpy中定义的最重要的对象是成为ndarray的N维数组类型

它描述相同类型的元素集合。可以使用基于零的索引访问集合中的项目。大部分的数组操作仅仅是修改元数据部分,而不改变其底层的实际数据。

数组的维数称为秩,简单来说就是如果你需要获取数组中一个特定元素所需的坐标数

如a是一个2×3×4的矩阵,你索引其中的一个元素必须给定三个坐标a[x,y,z],故它的维数就是3。

数组中所有元素的类型必须是一致的,Python支持的数据类型有整型、浮点型以及复数型

但这些类型不足以满足科学计算的需求,因此NumPy中添加了许多其他的数据类型

如bool、inti、int64、float32、complex64等。同时,它也有许多其特有的属性和方法。

import numpy as np
vector = np.array([5,10,15,20])
matrix = np.array([[5,10,15],[20,25,30],[30,35,40]])
print (vector)
print (matrix)

我们可以就看到,这里我写了一个行向向量,和一个矩阵向量

Numpy库的学习(一)

可以得到如上图所示的结果,打印出一个行向量,和一个3行3列的矩阵向量

ndarray中有很多个可以调用的属性,我们可以做一些分析等等操作

首先讲一下shape属性

vector = np.array([1,2,3,4])
print(vector.shape)
matrix = np.array([[5,10,15],[20,25,30],[30,35,40]])
print (matrix.shape)

Numpy库的学习(一)

可以看到,运行上面的代码我们得到这样一个结果

shape就是说,我要看一下这个向量的维度是多少

第一个向量,vector是一个行向量,所以说打印出来只有当前的向量中的元素个数4

对于第二行结果来说, 他是一个3X3的矩阵向量,(3,3)表示我们当前打印的数据

是一个3行3列的矩阵向量

接下来看看这个例子

number = np.array([1,2,3,4])
print(number)
number.dtype

Numpy库的学习(一)

可以看到,运行上面的代码,我们可以得到一个dtype类型值

这个值是表示我们的dtype的格式为int32,下面我们来做一些变化

number = np.array([1,2,3,4.0])
print(number)
number.dtype

Numpy库的学习(一)

我们可以看到,这里numpy帮我们自动转换了数据格式

讲所有的整数类型,全部都换成了浮点型

dtype也变成了float64类型,我们在做些变化

number = np.array([1,2,3,''])
print(number)
number.dtype

我们把4修改为字符串类型

Numpy库的学习(一)

得到的结果,数据全都变成字符串类型了,数据类型也变了

也就是说,在numpy的ndarray中,必须传进来的数据类型,都是同一种结构的

我们现在来讲下如何使用numpy来读取文件数据

Numpy库的学习(一)

我们这里有些测试数据,名为1.txt文件

TestTxt = np.genfromtxt('1.txt',delimiter=".", dtype=str ,skip_header=1)
print(TestTxt)

这段代码的意思是,是用numpy中的genfromtxt方法读取文件

参数为,1.txt文件名称,delimiter 以什么进行分割这里用 . 点号进行分割

dtype =str 指定当前的数据类型为字符串

skip_header=1 ,指定去掉第一行数据

得到如下结果

Numpy库的学习(一)

得到了文件中的内容,转换成了矩阵,读出来的数据都是一种矩阵数据格式

当然这个文件读取方式不会经常用到,后面讲另外一个更好用的,pands库中的

这里就不多讲numpy中的文件读取

如果我想取出上面矩阵中的某个值,怎么操作呢?

比如我们想取出第三行的第一个数据

第四行的第二个数据

out = TestTxt[2,0]
out1 = TestTxt[3,1]
print(out)
print(out1)

运行上诉代码

Numpy库的学习(一)

可以看到,在numpy中,index下标是从0开始的,而不是1

所以一定要切记

我们在定义一个向量

vector = np.array([5,10,15,20,25])
print(vector[0:3])

我想打印向量中的前三个值

Numpy库的学习(一)

可以看到,这里的操作和python中的切片操作一样

选取0到3,包括0但是不包括3

那么对于矩阵来说也是一样的

matrix = np.array([
[1,2,3],
[4,5,6],
[7,8,9],
])
print(matrix[:,1])

Numpy库的学习(一)

我想打印当前矩阵所有样本的第二列

matrix[:,1]

那么这里用逗号隔开,第个表示行,第二个表示列,表示取所有行的第二列

用:进行站位

我想取所有行的前两列怎么取呢?

matrix = np.array([
[1,2,3],
[4,5,6],
[7,8,9],
])
print(matrix[:,0:2])

这里可以看到,取全部行,的0号,和1号列,2号不包含

Numpy库的学习(一)

得到结果,也很简单

那么我如何取某几行,某几列呢?方法也是一样的

matrix = np.array([
[1,2,3],
[4,5,6],
[7,8,9],
])
print(matrix[1:3,0:2])

取第2,3行的,1,2列

那么可以得到

Numpy库的学习(一)

好的,今天的numpy库就讲到这里。下次我们继续说。感觉阅读欢迎点赞转发。谢谢各位!