详解C++中的vector容器及用迭代器访问vector的方法

时间:2022-03-02 04:32:06

vector

vector是相同类型对象的集合。集合中的每个对象有个对应的索引。vector常被称为容器(container)。
为了使用vector,需要:

?
1
2
#include <vector>
using std::vector;

vector是一个类模版(class template)。C++有函数模版和类模版。模版本身不是函数或类,必须通过指定 类型让编译器去实例化(instantiation)它。比如vector<int> ivec。
vector是模版,不是类型。从vector得到的类型要包含元素的类型。
早期C++定义vector的元素是vector是,最后一个闭括号前必须有一个空格,如vector<vector<int> >。但是C++ 11不要求这样。
定义和初始化vectors

最常有的定义vectors的方法如下:

方法 解释
vector v1 默认初始化,v1是空的
vector v2(v1) v2有v1每个元素的拷贝
vector v2 = v1 等价于v2(v1)|
vector v3(n, val) v3有n个val
vector v4(n) v3有n个元素,每个元素是value-initialized
vector v5{a, b, c, ...} v5的元素即a, b, c, ...
vector v5 = {a, b, c, ...} 等价于v5{a, b, c, ...}

需要注意的是,最常用使用vector的方法就是定义一个起初为空的vector,即vector<T> v,在运行时指定元素。
vector的列表初始化(list initializing)

 

上面使用花括号(curly brace)的方法是列表初始化,是C++ 11引入的。
比如,

?
1
vector<string> articles = {"an", "a", "the"};

我们看到C++有很多初始化的方式,很多情况下它们是可以互换的,但有些时候初始化的形式是不能换的:
当使用拷贝初始化形式(即使用=),只能提供单个初始化器
当提供in-class初始化,只能是拷贝初始化或者花括号
列表初始化只能使用花括号,不能是圆括号
有关value-initialized

前面提到vector<int> ivec(10)这种只指定元素个数的初始化方法,每个元素是value-initialized。即:
对内置类型,值为0
对类类型,使用默认初始化
花括号,圆括号

?
1
2
3
4
vector<int> v1(10); // 10个元素,都是0
vector<int> v1{10}; // 1个元素,是10
vector<int> v1{10, 1}; // 2个元素,分别是10, 1
vector<int> v1(10, 1); // 10个元素,都是1

需要注意的是,使用{}并不一定就是列表初始化;它表示: 如果可能的话,使用列表初始化。

?
1
2
3
vector<string> v5{"hi"}; // ok, list initialization
vector<string> v6("hi"); // error: cann't construct vector from string lieral
vector<string> v7{10}; // has ten default-initialized value.

上面的v7就使用花括号指定个数,而不是列表初始化。
向vector添加元素

使用push_back方法。
重要概念:vector高效增长:
标准要求vector的实现能够在运行时高效添加。如果在定义vector时指定了大小,就显得没必要,甚至导致 差的性能。总之,一般直接开始定义一个空的vector。
另外,我们要确保即使循环改变了vector的大小,循环也是正确的。因此,不能在range for里面向vector添加元素。
其它的vector操作

最常用的操作有:

方法
v.empty()
v.size()
v.push_back(t)
v[n]
==, !=, <, <=, >, >=

类似的,v.size()返回的类型也是size_type的。需要注意的是,模版类的类型始终是包括元素类型的,

 

?
1
2
vector<int>::size_type // ok
vector::size_type // error

关于下标访问,它只能访问已经存在的元素,不会添加。

?
1
2
3
4
5
vector<int> ivec;
cout << ivec[0]; // error
 
for (decltype(ivev.size()) ix = 0; ix != 10; ix++)
  ivec[ix] = ix; // disaster: has no element

  
迭代器
尽管我们可以使用下标来访问字符串中的字符或vector的元素,但更一般的机制是使用迭代器(iterator)。
所有的容器都支持迭代器,但仅少数几个支持下标操作。
合法的迭代器:

  • 指示某个元素
  • 指示最后一个元素的下一个位置
  • 其它的迭代器都是不合法的。
  • 使用迭代器

使用begin和end成员函数。

?
1
2
// b 指示第一个元素;e 指示最后一个元素的下一个位置
auto b = v.begin(), e = v.end();

一般我们不必关心迭代器的准确类型,所以直接使用auto。
end返回的迭代器一般被称为off-the-end迭代器,或者缩写为end迭代器。
显然,如果一个容器为空,begin返回的和end返回的相同。
迭代器的操作

| 方法 | 解释 | | iter | 返回指示元素的引用 | | iter->mem | 解引用iter,并获取名字为mem的成员,等价于 (iter).mem | | ++iter | 增加iter,指示下一个 | | --iter | 减小iter,指示前一个 | | == , != | 比较 |
下面是把遇到空白字符前的字符转成大写。

?
1
2
for(auto it = s.begin(); it != s.end() && !isspace(*it); ++it)
  *it = toupper(*it);

熟悉C或者Java语言的人可能需要习惯C++里面for循环一般都是使用!=结束,而不是使用<。 这是因为,所有的容器的迭代器都定义了!=和==方法;而绝大部份迭代器没有<方法。通过使用!=,我们可以不必 关心处理容器的准确类型。
迭代器的类型

就像我们不知道vector或string的size_type的准确类型,我们一般也不知道迭代器的准确类型。
库类型的迭代器定义了iterator和const_iterator两种类型。

?
1
2
3
vector<int>::iterator it; // 可读,可写
vector<int>::iterator it2; // 可读,可写
vector<int>::const_iterator it3; // 可读,不能写

const_iterator的行为类似一个const指针。就像const指针,const_iterator不能修改所指示的元素。如果 一个vector或者字符串是const的,那么只能使用const_iterator。
如果对象是const的,那么begin和end返回的就是const_iterator;如果对象不是const的,返回的就是iterator。 但这种行为有时不是我们想要的,即针对非const对象,我们也希望得到const_iterator。C++ 11引入了两个新的函数, cbegin和cend解决了这一问题。

?
1
auto it3 = v.cbegin();

解引用和访问成员

当对迭代器解引用时,得到的是其指示的对象。如果该对象是个类类型的,我们可能要访问其的成员。举个例子,一个字符串的vector可能想知道 给定元素是否为空,可以使用(*it).empty()。
需要注意的是,(*it).empty()这个括号是必须的。否则,点操作符直接作用于it。因此,*it.empty()是错误的。
为了简化这种表示,语言定义了箭头操作符(->),它把解引用和成员访问组合为一个符号,即it->empty()。
迭代器的算术

自增与自减是所有迭代器都支持的操作。
而对于string和vector的迭代器,还支持额外的算术操作。
| 方法 | | iter + n | | iter - n | | iter1 += n | | iter2 -= n | | iter1 - iter2 | | >, >=, <, <= |
比如,计算vector中间位置,

?
1
auto mid = vi.begin() + vi.size() / 2;

需要注意的是,迭代器的相加是不合法的。