第五章《数组》
一、概念
根据数组中存储的数据元素之间的逻辑关系,可以将数组分为 : 一维数组、二维数组、…、n维数组。
n维数组中,维数 n 的判断依据是:根据数组中为确定元素所在位置使用的最少的下标个数。例如,二维数组中想唯一确定一个元素的位置,至少需要使用 2 个下标, a[1][1]:行坐标为 1,列坐标为 1 的数据元素的值。
二、数组VS顺序表
①数组作为一种数据类型,作用是将类型相同的数据存储在一整块内存中,数组中存储的数据之间没有任何逻辑关系,谁也不认识谁。
②顺序表作为线性表的存储结构,存储的这些数据元素在物理存储结构上相邻的同时,在逻辑结构上也相邻,每个数据元素都清楚地知道紧挨着它的前边的元素和后边的元素。
简要概述:用数组来存储的线性表是顺序表。
三、数组的逻辑结构
数组它可以看作线性表的推广。数组作为一种数据结构其特点是结构中的元素本身可以是具有某种结构的数据,但属于同一数据类型,比如:一维数组可以看作一个线性表,二维数组可以看作“数据元素是一维数组”的一维数组,三维数组可以看作“数据元素是二维数组”的一维数组,依此类推。所以,n 维数组可以看作是线性表的一种扩展。
数组是一个具有固定格式和数量的数据有序集,每一个数据元素有唯一的一组下标来标识,因此,在数组上不能做插入、删除数据元素的操作。通常在各种高级语言中数组一旦被定义,每一维的大小及上下界都不能改变。在数组中通常做下面两种操作:
(1)取值操作:给定一组下标,读其对应的数据元素。
(2)赋值操作:给定一组下标,存储或修改与其相对应的数据元素。
我们着重研究二维和三维数组,因为它们的应用是广泛的,尤其是二维数组。
四、数组的存储
按元素的下标求m×n二维数组中某个数据元素 aij地址的计算:
①行优先:LOC(aij) = LOC(a00) + ( i*n + j ) * s
②列优先:LOC(aij) = LOC(a00) + ( i*m + j ) * s
其中,LOC(i,j) : aij 在内存中的地址;LOC(0,0) : a00 存储的地址,其实就是整个二维数组存放的起始地址。
【例】设二维数组A[6][10],每个数组元素占4个存储单元,若按行优先顺序存放的数组元素A[3][5]的存储地址是1000,求A[0][0]的存储地址。 解: 1000= X + (10*3+5)*4 解的:X=860
五、特殊矩阵的压缩存储
如果矩阵中有很多数值相同的数据元素,在存储时,可以考虑对其进行适当的压缩存储。
有必要压缩存储的矩阵大致分为两大类:
①矩阵中含有大量的相同数值,称为特殊矩阵(例如对称矩阵和上下三角矩阵)。
②矩阵中只有极少量的元素是非 0 元素,称为稀疏矩阵。
两类矩阵压缩存储的方法:
①特殊矩阵中,对于相同的数据元素,只存储一个。
②稀疏矩阵中,只需要存储非 0 元素。
(1)对称矩阵
定义:n阶矩阵中的元素满足: aij = aji ( i 为行标, j 为列标)
图为 3 阶对称矩阵,图中的虚线为矩阵的 “主对角线” ,主对角线上方区域称为 “上三角” ;主对角线下方称为 “下三角” ,沿主对角线对称的数据元素一一相等,所以对于此矩阵来说,只需要存储 6 个元素即可(1,2,3,4,5,6)。
原来需要n*n个存储单元,现在只需要n(n+1)/2个存储单元了,节约了n(n-1)/2个存储单元,当n较大时,这是可观的一部分存储资源。
若将对称矩阵压缩存储在一维数组 S[k] 中,矩阵中数据元素在数组中存储的位置和所在的行标(用 i 表示)和列标(用 j 表示)有关。
对称矩阵沿主对角线对称的数据元素相等,任选一边的数据元素进行存储即可:
①存储下三角区域的数据元素:
②存储上三角区域的数据元素:
综上所述,对于对称矩阵中的任意元素aij,若令I=max(i,j),J=min(i,j),则将上面两个式子综合起来得到: k=I*(I-1)/2+J-1
(2)上下三角矩阵
定义:上下三角矩阵,和对称矩阵类似,不同在于,上三角矩阵是指主对角线下方的元素(不包括主对角线上的)都是常数C(包括数值 0 );同理,下三角矩阵是指主对角线上方的元素都是常数C。
存储时,上(下)三角存储上(下)三角的数据元素,除此之外,额外存储一个下(上)三角含有的常数C(图中,C==0)
(3)对角矩阵
定义:除了主对角线和它的上下*干条对角线的元素外,所有其他元素都为零(或同一个常数c)
(4)稀疏矩阵
定义:矩阵中只含有少量的非 0 元素,相比于使用普通方式将矩阵中的所有数据元素一一存储,只存储非 0 元素更节省内存空间。
矩阵压缩存储的方式有 3 种,分别为:①三元组顺序表、②行逻辑链接的顺序表、③十字链表
①三元组顺序表
定义:除了要存储非 0 元素的值之外,还需要存储元素所在矩阵中的行标 i 和列标 j ,三个元素构成三元组(行标,列标,元素值)
结构体:
//三元组结构体 typedef struct { int i,j;//行标i,列标j int data;//元素值 }triple;
每个稀疏矩阵的表示,需要存储矩阵中所有非 0 元素的三元组,并且还需要记录矩阵的行数和列数,这样才能唯一确定一个稀疏矩阵。
矩阵的结构也需要使用结构体实现:
#define number 100 //矩阵的结构表示 typedef struct { triple data[number];//存储该矩阵中所有非0元素的三元组 int n,m,num;//n和m分别记录矩阵的行数和列数,num记录矩阵中所有的非0元素的个数 }TSMatrix;
//例如,对于图 3 的稀疏矩阵来说,即将(2,2,3)、(2,3,4)、(3,2,5)存储进 data 数组,并且存储稀疏矩阵的行数 3 和列数 3 ,该稀疏矩阵中非 0 元素有 3 个。
②行逻辑链接的顺序表
使用三元组顺序表存储矩阵后,当需要提取矩阵某一行的非 0 元素时,需要遍历整个顺序表。
为了提高查找的效率,在三元组顺序表的基础上,增加一个数组用于记录每一行第一个非 0 元素的存储位置,这样的存储结构,称为:行逻辑链接的顺序表。
#define number 100 typedef struct { int i,j; int data; }triple; typedef struct { triple data[number]; int rpos[number];//存储各行第一个非0元素在三元组表中的位置 int n,m,num; }TSMatrix;
③十字链表
以上两种存储稀疏矩阵的方法,说到底,还是操作数组,在进行矩阵运算过程中,如果有插入非 0 元素或者删除某一个元素的操作,可能需要大量的移动数组中的三元组。
例如在进行“将矩阵 B 加到矩阵 A 上”的操作时,矩阵 A 中的数据元素会发生很大的变化,之前的 0 元素可能变成非 0 元素,非 0 元素也可能变成 0 (正负数相加为 0)。在这种情况下,就需要使用链表的存储结构来存储矩阵,这种存储方式称为:十字链表法。
例如,将下列矩阵以十字链表的方式存储起来:
采用十字链表法存储矩阵的非 0 元素时,链表中的结点由 5 部分组成:
两个指针域:一个指向所在列的下一个元素,一个指向所在行的下一个元素。
typedef struct OLNode{ int i,j; int data; struct OLNode * right,*down; }OLNode; //此结构体表示一个矩阵,其中包含矩阵的行数,列数,非0元素的个数以及用于存储各行以及各列元素头指针的动态数组rhead和chead。 typedef struct { OLNode * rhead,*chead; int n,m,num; }CrossList;
总结:
稀疏矩阵的三种不同的存储方法,采用哪种方法要看程序具体要实现的功能:
--如果想完成例如矩阵的转置这样的操作,宜采用三元组顺序表;
--如果想实现矩阵的乘法这样的功能,宜采用行逻辑链接的顺序表;
--如果矩阵运算过程中(例如矩阵的加法),需要不断地插入非 0 元素或删除变为 0 的元素,宜采用十字链表法。