几乎所有的语言都把数组作为一种固有的数据类型,数组也是我们最常用的数据结构之一。在语言底层,数组是如何实现的呢?本文以抽象数据类型的形式,定义、实现数组。
创建数组,理论上,我们可以使用创建任意维度的数组;但这个多维只是我们“感知”上的多维度,实际上,内存是一种线性存储单元,不可能实现真正的多维。换言之,多维数组在内存中也是顺序的排在一维,占用连续的一段存储空间。
以二维数组为例。存储数组时,可以使用行优先存储,即先存第一行…再存第二行……当然也可以使用列优先(Fortran语言就采用了列优先)。大多数语言还是行优先的,下面我就以行优先存储,定义和表示数组。
Def:n维数组的映像函数
一个数组的各个维度的下标与内存中的存储单元有着一一对应,这是必然的。这个对应关系称作映像函数。以三维为例,映像函数是:(这里就不展开一般情况了)
Loc(i,j,k) = Loc(0,0,0) + ((b2*b3)*i + (b3) * j + i) * L
其中:
Loc(0,0,0): 基地自
bi: 为第i维的长度 ;
L : 地址的加减以元素大小为单位为了方便程序,映像函数显然可以定义如下:
Loc(j1,j2,j3) = Loc(0,0,0) + sum(ci*ji)
其中:
i = 1 to n
cn = L;ci-1 = ci*bi
可见,计算各元素位置的时间相同,存取任意元素时间都是单位O(1)。这叫做“随机存储结构” 。
有了上述定义,就可以实现数组,以及实现数组的基本操作。下面的实现使用了“可变长参数”,后面我可给出了比较详细的参考资料。下面的注释非常清楚了。
#include<cstdio>
#include<iostream>
#include<stdlib.h>
#include<stdarg.h> //标准头文件,提供宏va_start,va_arg,va_end。来使用可变长参数
#define MAX_DIM 8 //最大维度
#define ElemType int //数据类型
using namespace std;
//数组 表示
typedef struct{
ElemType *base; //数组的基地址
int dim; //维度
int *bounds; //维度是可变参数,存各维度的长度
int *constants; //这里就是上面说的ci
}Array; /*
基本操作如下
*/
void InitArray(Array &A,int dim,...){
/*先判断维度,以及各维度长度是否合法*/
if(dim<||dim >MAX_DIM) return;
A.dim = dim;
A.bounds = (int*)malloc(dim*sizeof(int)); //bounds存各维度的长度,故开辟空间为dim*dizeof(int)
if(!A.bounds) exit();
int elemtotal = ; //元素总个数,实际上,总个数为各维度长度的乘积
//先传一个数组,用来存可变长参数信息表的数组, dim是长度
va_list argp;
//等同于 char*argp,va_list就是一个指向第一个可变参数的指针
/*argp指向传入的第一个可选参数,第二个参数是可变参数之前的第一个参数名,必须有,因为要靠这个去找可变参数在哪里*/
/*这里把上面得到的字符指针argp,后移动4个字节,就是跳过dim的内存地址 */
va_start(argp,dim);
for(int i = ;i<dim;i++){
A.bounds[i] = va_arg(argp,int);//这里把ap往后跳过4个字节(sizeof(int)大小)指向下一个参数,返回的是当前参数(而非下一个参数)
if(A.bounds[i]<) return;
elemtotal *= A.bounds[i];
}
va_end(argp); A.base = (ElemType*)malloc(elemtotal * sizeof(ElemType));
if(!A.base) exit(); //下面再求映像函数的参数常数ci,有了这个可以很方便地取每一个元素
A.constants = (int*)malloc(dim*sizeof(int));
if(!A.constants) exit();
A.constants[dim-] = ;//L = 1,指针得增减以元素的大小为单位
for(int i = dim-;i>=;i--){
A.constants[i] = A.bounds[i+] * A.constants[i+];
}
return;
}
/*销毁函数*/
void Destory(Array &A){
if(!A.base){
return;
}
free(A.base);A.base = NULL;
if(!A.bounds){
return;
}
free(A.bounds);A.bounds = NULL;
if(!A.constants){
return;
}
free(A.constants);A.constants = NULL;
return;
}
/*求指定元素的地址,即off,求的是相对基地址的偏移*/
void Locate(Array A,va_list ap,int &off){
off = ;
for(int i = ;i<A.dim;i++){
//用va_arg去取元素,然后自动后移int位
//va_list ap就是第一个元素的地址
int ind = va_arg(ap,int);
if(ind<||ind>=A.bounds[i]) return; //是否合法
//求地址的公式!
off += ind * A.constants[i];
}
//return off;
} void Value(Array A,ElemType &e,...) {
//A是n维数组 e 是要去取得元素,...是n个下标 //创建取不定参数的指针
va_list ap;
//初始化,通过va_start() 实现
va_start(ap,e); int off;
//off存放元素e地址
Locate(A,ap,off);
//取元素,返回e
if(off <= ) return; //这其实也判断了下标是否合法
//关闭
va_end(ap);
e = *(A.base+off);
}
//赋值语句
void Assign(Array &A,ElemType e,...){
//A是n维数组,e是元素变量,...是下标
//即把指定下标的元素赋值成e
va_list ap;
va_start(ap,e);
int off;
Locate(A,ap,off);
if(off <= ) return;
*(A.base + off) = e;
va_end(ap);
return;
} int main(){
//测试 Array A;
InitArray(A,,,,);
Assign(A,,,,);
Assign(A,,,,);
int e = ;
Value(A,e,,,);
printf("e1:%d\n",e);
int e2 = ;
Value(A,e2,,,);
printf("e2:%d\n",e2);
printf("成功...");
}上面用到的可变参数以及stdarg头文件的比较好的学习信息:
https://www.cnblogs.com/justinzhang/archive/2011/09/29/2195969.html
总结使用stdarg的步骤:
va_start() va_arg() va_end() va_list 的使用:
<Step > 在调用参数表之前,定义一个 va_list 类型的变量,(假设va_list 类型变量被定义为ap);
<Step > 然后应该对ap 进行初始化,让它指向可变参数表里面的第一个参数,这是通过 va_start 来实现的,第一个参数是 ap 本身,第二个参数是在变参表前面紧挨着的一个变量,即“...”之前的那个参数;
<Step > 然后是获取参数,调用va_arg,它的第一个参数是ap,第二个参数是要获取的参数的指定类型,然后返回这个指定类型的值,并且把 ap 的位置指向变参表的下一个变量位置;
<Step > 获取所有的参数之后,我们有必要将这个 ap 指针关掉,以免发生危险,方法是调用 va_end,他是输入的参数 ap 置为 NULL,应该养成获取完参数表之后关闭指针的习惯。说白了,就是让我们的程序具有健壮性。通常va_start和va_end是成对出现。