csr_matrix(Compressed Sparse Row matrix)存储模式浅析

时间:2021-11-12 21:23:06

压缩稀疏矩阵的某种存储方式(开始不是很懂,后来发现网上解释的也不是很清楚,故来解释一发。以下为官方的例子)

此处官方文档介绍传送门

>>> indptr = np.array([0, 2, 3, 6])
>>> indices = np.array([0, 2, 2, 0, 1, 2])
>>> data = np.array([1, 2, 3, 4, 5, 6])
>>> csr_matrix((data, indices, indptr), shape=(3, 3)).toarray()
array([[1, 0, 2],
[0, 0, 3],
[4, 5, 6]])
(注:论文的行下标和列下标均从0开始)

data 表示 元数据 显然为1, 2, 3, 4, 5, 6

shape 表示 矩阵的形状 为 3 * 3

indices 表示 各个数据在各行的下标, 从该数据我们可以知道:数据1在某行的0位置处, 数据2在某行的2位置处,6在某行的2位置处。

而各个数据在哪一行就要通过indptr参数得到的

indptr 表示每行数据的个数:[0 2 3 6]表示从第0行开始数据的个数,0表示默认起始点,0之后有几个数字就表示有几行,第一个数字2表示第一行有2 - 0 = 2个数字,因而数字1,2都第0行,第二行有3 - 2 = 1个数字,因而数字3在第1行,以此类推,我们能够知道所有数字的行号

Example: 数字6 ,indptr推出在第2行,indices推出在第2列。

(若有不正,敬请指出)