标准库类型vector

时间:2024-01-15 21:21:38

标准库类型vector表示对象的集合,其中所有对象的类型都相同。集合中的每个对象都有一个与之对应的索引,索引用于访问对象。因为vector“容纳着”其他对象,所以它被称为容器。

要想使用vector,必须包含适当的头文件。#include<vector>

C++语言既有类模板,也有函数模板 ,其中vector是一个类模板。

模板本身不是类或函数,相反可以将模板看作为编译器生成类或者函数编写的一份说明。编译器根据模板创建类或函数的过程成为实例化,当使用模板时,需要指出编译器应把类或函数实例化为何种类型。

对于类模板,我们通过提供一些额外的信息来指定模板到底实例化成什么样的类,需要提供哪些信息由模板决定。提供信息的方式总是这样:即在模板名字后面跟一对尖括号,在括号内放上信息。

以vector为例,提供的额外信息时vector内所存放对象的类型:

vector<int> ivec;   //Ivec保存int类型的对象

vector<Sales_item> Sales_vec;  //保存Sales_item类型的对象

vector<vector<string>> file;  //该向量的元素师vector对象

在上面的例子中,编译器根据模板vector生成了三种不同的类型:vector<int>、vector<Sales_item>和vector<vector<string>>。

vector能容纳绝大多数类型的对象作为其元素,但是因为引用不是对象,所以不存在包含引用的vector。除此之外,其他大多数(非引用)内置类型和类类型都可以构成vector对象,甚至组成vector的元素也可以是vector。

定义和初始化vector对象

和任何一种类类型一样,vector模板控制着定义和初始化向量的方法。

初始化vector对象的方法  

vector<T> v1      v1是一个空vector,它潜在的元素师T类型的,执行默认初始化

vector<T> v2(v1)    v2中包含有v1所有元素的副本

vector<T> v2=v1    等价于v2(v1),v2中包含有v1所有元素的副本

vector<T> v3(n,val)   v3包含了n个重复的元素,每个元素的值都是val

vector<T> v4(n)      v4包含了n个重复地执行了值初始化的对象

vector<T> v5{a,b,c....} v5包含了初始值个数的元素,每个元素被赋予相应的初始值

vector<T> v5={a,b,c...} 等价于v5{a,b,c...}

可以默认初始化vector对象,从而创建一个指定类型的空vector:

vector<string> svec;  //默认初始化,svec不含任何元素

看起来空vector好像没什么用,但是很快我们就会知道程序在运行时可以很高效地往vector对象中添加元素。事实上,最常见的方式就是先定义一个空vector,然后的当运行时获取到元素的值后再逐一添加。

当然也可以在定义vector对象时指定元素的初始值。例如,允许把一个vector对象的元素拷贝给另外一个vector对象。此时,新vector对象的元素就是原vector对象的元素对应元素的副本。注意两个vector对象的类型必须相同。

vector<int> ivec;  //初始化态为空

vector<int> ivec2(ivec);  //把ivec的元素拷贝给ivec2

vector<int> ivec3=ivec;  //把ivec的元素拷贝给ivec3

vector<string> svec(ivec2);  //错误:svec的元素是string对象,不是int

列表初始化vector对象

C++11新标准提供了另外一种为vector对象的元素赋初值的方法,即列表初始化。此时,用花括号括起来的0个或多个初始元素值被赋给vector对象:

vector<string> articles={"a","an","the"};

上述vector对象包含三个元素:第一个是字符串”a“,第二个是字符串”an“,最后一个是字符串”the“。

之前已经讲过,C++语言提供了几种不同的初始化方式。在大多数情况下这些初始方式可以相互等价地使用,不过也并非一直如此。目前已经介绍过的两种例外情况是:其一,使用拷贝初始(即使用=时),只能提供一个初始值;其二,如果提供的是一个类内初始值,则只能使用拷贝初始化或使用花括号的形式初始化。第三种特殊的要求是,如果提供的是初始化元素值得列表,则只能把初始值都放在花括号里进行列表初始化,而不是放在圆括号里

vector<string> v1{"a","an","the"};  //列表初始化

vector<string> v2("a","an","the"};  //错误

创建指定数量的元素

还可以用vector元素容纳的元素数量和所有元素的统一初始值来初始化vector对象:

vector<int> ivec(10,-1);  // 10个int类型的元素,每个都被初始化为-1

vector<string> svec(10,"hi");  //10个string类型的元素,每个都被初始化为”hi“

值初始化

通常情况下,可以只提供vector对象容纳的元素数量而不用略去初始值。此时库会创建一个值初始化元素初值,并把它赋给容器中的所有元素。这个初值由vector对象中元素的类型决定。

如果vector对象的元素师内置类型,比如int,则元素初始值自动设为0。如果元素是某种类类型,比如string,则元素由类默认初始化:

vector<int> ivec(10);  //10个元素,每个都初始化为0

vector<string> svec(10);  //10个元素,每个都是空string对象

对这种初始化的方式有两个特殊限制:其一,有些类要求必须明确地提供初始值,如果vector对象中元素的类型不支持默认初始化,我们就必须提供初始的元素值。对这种类型的对象来说,只提供元素的数量而不设定初始值无法完成初始化工作。

其二,如果只提供了元素的数量而没有设定初始值,只能使用直接初始化,不能使用拷贝初始化:

vector<int> vi=10;//错误:必须使用直接初始化的形式指定向量的大小。

这里的10是用来说明如何初始化vector对象的,我们用它的本意是想创建含有10个值初始化了的元素的vector对象,而非把数字10“拷贝”到vector中。因此,此时不宜使用拷贝初始化。

列表初始化还是元素数量?

在某些情况下,初始化的真实含义依赖于传递初始值时用的是花括号还是圆括号,例如,用一个整数来初始化vector<int>时,整数的含义可能是vector对象的容量也可能是元素的值。类似的,用两个整数来初使化vector<int>时,这两个整数可能一个是vector对象的容量,另一个是元素的初值,也可能它们是容量为2的vector对象中两个元素的初值。通过使用花括号或圆括号可以区分上述这些含义:

vector<int>v1(10);//v1有10个元素,每个的值都是0

vector<int> v2{10};//v2有1个元素,该元素的值时10

vector<int> v3(10,1);//v3有10个元素,每个的值都是1

vector<int> v4{10,1}; //v4有两个元素,值分别是10,1

如果用圆括号,可以说提供的值是用来构造vector对象的。例如,v1的初始值说明了vector对象的容量;v3的两个初始值则分别说明了vector对象的容量和元素的初值。

如果用的是花括号,可以表述成我们想列表初始化该vector对象。也就是说,初始化过程会尽可能地把花括号内的值当成是元素初始值的列表来处理,只有在无法执行列表初始化时才会考虑其他初始化方式。在上例中,给v2和v4提供的初始值都作为元素的值,所以它们都会执行列表初始化,vector对象v2包含一个元素而vector对象v4包含两个元素。

另一方面,如果初始化时使用了花括号的形式但是提供的值又不能用来列表初始化,就要考虑用这样的值来构造vector对象了。例如,要想列表初始化一个含有string对象的vector对象,应该提供能赋给string对象的初值。此时不难区分到底是要列表初始化vector对象的元素还是用给定的容量值来构造vector对象:

vector<string> v5{"hi};  //列表初始化,v5有一个元素

vector<string> v6("hi");//错误,不能使用字符串字面值构造vector对象

vector<string> v7(10);  //v7有10个默认初始化的元素

vector<string> v8{10,"hi"}; //v8有10个值为”hi“的元素

向vector对象中添加元素

对vector对象来说,直接初始化的方式适用于三种情况:初始值已知且数量较少、初始值是另一个vector对象的副本、所有元素的初始值都一样。然而更常见的情况是:创建一个vector对象时并不清楚实际所需的元素个数,元素的值也经常无法确定。还有些时候即使元素的初值已知,但如果这些值总量较大而各不相同,那么在创建vector对象的时候执行初始化操作也会显得过于繁琐。

对于这种情况,最好的处理方式是先创建一个空vector,然后在运行时再利用vector的成员函数push_back向其中添加元素。push_back负责把一个值当成vector对象的尾元素“压到”vector对象的“尾端”。例如:

vector<int> v2;   //空vector对象

for(i=0;i!=100;i++)

  v2.push_back(i);   //依次把整数值放到v2尾端

在上例中,尽管知道vector对象最后会包含100个元素,但在一开始还是把它声明成空vector,在每次迭代时才顺序地把下一个整数作为v2的新元素添加给它。

同样的,如果直到运行时才能知道vector对象中元素的确切个数,也应该使用刚刚这种方法创建vector对象并为其赋值。例如,有时需要实时读入数据然后将其赋予vector对象:

string word;

vector<string> text;  //空vector对象

while(cin>>word){

  text.push_back(word);  //把word添加到text后面

}

和之前的例子一样,本例也是先创建一个空vector,之后依次读入未知数量的值并保存到text中。

其他vector操作

除了push_back之外,vector还提供了几种其他操作,大多数都是和string的相关操作类似。

vector支持的操作

v.empty()         如果v不含有任何元素,返回真;否则返回假

v.size()          返回v中元素的个数

v.push_back(t)      向v的尾端添加一个值为t的元素

v[n]           返回v中第n个元素的引用

v1=v2          用v2中元素的拷贝替换v1中的元素

v1={a,b,c.....}       用列表中元素的拷贝替换v1中的元素

v1==v2          v1和v2相等当且仅当它们的元素数量相同且对应位置的元素值相同

v1!=v2         

<,<=,>,>=        顾名思义,以字典顺序进行比较

vector的empty和size两个成员与string的同名成员功能完全一致:empty检查vector对象是否包含元素然后返回一个布尔值;size则返回vector对象中元素的个数,返回值的类型是由vector定义的size_type类型。

要使用size_type,首先需要指定它是由哪种类型定义的。vector对象的类型总是包含着元素的类型

vector<int>::size_type    //正确

vector::size_type        //错误

只有当元素的值可比较时,vector对象才能被比较。一些类,如string等,确实定义了自己的相等性运算符和关系运算符;另外一些,如Sales_item类没有定义相等性判断和关系运算符操作。因此,不能比较两个vector<Sales_item>对象。

不能用下标形式添加元素

刚接触C++语言的程序员也许会认为可以通过vector对象的下标形式来添加元素,事实并非如此。下面的代码试图为vector对象ivec添加10个元素:

vector<int> ivec;//空vector对象

for(decltype(ivec.size()) ix=0;ix!=10;++ix)

  ivec[ix]=ix;  //严重错误:ivec不包含任何元素

然而,这段代码是错误的:ivec是一个空vector,根本不包含任何元素,当然也就不能通过下标访问任何元素!如前所述,正确的方法是使用push_back:

for(decltype(ivec.size()) ix=0;ix!=10;++ix)

  ivec.push_back(ix);   //正确:添加一个新元素,该元素的值是ix

vector对象(以及string对象)的下标运算符可用于访问已存在的元素,而不能用于添加元素

提示:只能对确定已存在的元素执行下标操作!

关于下标必须明确的一点是:只能对确知已存在的元素执行下标操作。例如:

vector<int> ivec; //空vector对象

cout<<ivec[0];  //错误:ivec不包含任何元素

vector<int> ivec2(10);   //含有10个元素的vector对象

cout<<ivec2[10];  //错误:ivec2元素的合法索引是从0-9

试图用下标的形式去访问一个不存在的元素的行为非常常见,而且会产生很严重的后果。所谓的缓冲区溢出就是指的这类错误。

确保下标合法的一种有效手段就是尽可能使用范围for语句。