numpy中的matrix和array

时间:2022-04-04 01:41:42

Preface

在相关聚类算法的实现过程中,用python语言实现,会经常出现array和matrix的混淆,这里做个总结。

array数组

numpy中最基本(默认)的类型是array,他的相关操作都是按元素操作的即用作数值计算当中(按元素操作有+,-,,/,*等)。相乘举例:

    from numpy  import *
>>> a=array([1,2])
>>> a
array([1, 2])
>>> b=array([2,3])
>>> b
array([2, 3])
>>> c=a*b
>>> c
array([2, 6])
>>> dot(a,b)
8

两个array的相乘*指的是对应元素的相乘;两个array的dot表示矩阵的相乘。

  • 若a是array,则a.T表示转置。
  • 把array转换为matrix用asmatrix()

  • 多数numpy函数返回的是array类型,不是matrix类型。

matrix矩阵

在numpy中的特殊类型,是作为array的子类出现,所以继承了array的所有特性并且有自己的特殊的地方,专门用来处理线性代数操作(*表示矩阵的相乘,但是对于两个matrix的除/则表示对应元素的相除。)。乘法举例如:

    >>> m=mat([2,3])
>>> m
matrix([[2, 3]])
>>> n=([1,2])
>>> n
[1, 2]
>>> p=m*n
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python27\lib\site-packages\numpy\matrixlib\defmatrix.py", line 341, i
n __mul__
return N.dot(self, asmatrix(other))
ValueError: objects are not aligned
>>> dot(m,n)
matrix([[8]])
>>> multiply(m,n)
matrix([[2,6]])

* 两个matrix相乘错误原因是m的列不等于n的行,也即不对齐(aligned),若对齐了,则是对应元素的相乘,返回一个matrix;两个matrix的表示是两个矩阵的相乘。两个matrix的dot表示矩阵相乘。两个matrix的multiply表示对应元素的相乘。*

  • matrix中.H,.A,.I表示共轭,转置,逆矩阵。
  • 把matrix转换为array用asarray()
  • asanyarray()根据和你的输入的类型保持一致。

array和matrix的一个很难理解的点

这里会涉及到rank的概念,在线性代数(math)rank表示秩,但是必须明确的是在numpy里rank不是表示秩的概念,是表示维数的概念,这个理解的话需要看此文章:对于多维arrays的数据结构解释:
多维arrays数据结构理解

这里暂时理解为秩,虽然这样理解是错误的,但是可以说的通一些事情。(在实际的array和matrix里,英文里介绍的关于rank就用线性代数的秩来理解,但是英文会出现dimensions等于多少等,要求matrix的dimesions必须为2,这里其实指的就是秩,dimensions才是在numpy里的真实的理解形式)

array要求秩为1(N*1,1*N等)或者大于2
matrix要求秩必须为2(rank必须为2)

  • 下面是关于ndim和size的理解:
    >>> a
array([1, 2])
>>> b
array([[1, 2],
[2, 3]]
)
>>> c
matrix([[1, 2, 3, 4],
[2, 3, 4, 5]]
)
>>> d
array([[1, 2, 3, 4],
[2, 3, 4, 5]]
)
>>> e
matrix([[1, 2, 3, 4],
[2, 3, 4, 5],
[3, 4, 5, 6]]
)
>>> a.size
2
>>> a.ndim
1
>>> b.size
4
>>> b.ndim
2
>>> c.size
8
>>> c.ndim
2
>>> d.size
8
>>> d.ndim
2
>>> e.ndim
2
>>>e.size
12

这里ndim就是求的是rank,所以会发现matrix的都是2,但是array的就会存在差异,需要计算等。size返回的是元素的个数

  • 关于dim, shape, rank, dimension and axis in numpy的细节的问题理解:

*地址

补充

如何让

 M = matrix([[1], [2], [3], [4]])
如何转变为
array([1, 2, 3, 4])

比较优雅的办法:

>>> x=matrix(arange(12).reshape((3,4)))
>>> x
matrix([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
>>> x.getA1()
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])

总结

在运用中,还是用array好点,array的唯一缺陷就是在表示矩阵的相乘时候,要用dot,而不是*。

关于numpy里的array和matrix的其余的操作函数,另见wiki地址:http://wiki.scipy.org/NumPy_for_Matlab_Users