STL中vector的内存分配与正确释放

时间:2021-01-29 02:26:10

C++ STL中的vector的内存分配与释放

 

1.vector的内存增长

vector其中一个特点:内存空间只会增长,不会减小,援引C++ Primer:为了支持快速的随机访问,vector容器的元素以连续方式存放,每一个元素都紧挨着前一个元素存储。设想一下,当vector添加一个元素时,为了满足连续存放这个特性,都需要重新分配空间、拷贝元素、撤销旧空间,这样性能难以接受。因此STL实现者在对vector进行内存分配时,其实际分配的容量要比当前所需的空间多一些。就是说,vector容器预留了一些额外的存储区,用于存放新添加的元素,这样就不必为每个新元素重新分配整个容器的内存空间。

在调用push_back时,每次执行push_back操作,相当于底层的数组实现要重新分配大小;这种实现体现到vector实现就是每当push_back一个元素,都要重新分配一个大一个元素的存储,然后将原来的元素拷贝到新的存储,之后在拷贝push_back的元素,最后要析构原有的vector并释放原有的内存。例如下面程序:

STL中vector的内存分配与正确释放
#include <iostream>
#include <cstdlib>
#include <vector>

using namespace std;

class Point
{
public:
        Point()
        {
            cout << "construction" << endl;
        }
        Point(const Point& p)
        {
            cout << "copy construction" << endl;
        }
        ~Point()
        {
            cout << "destruction" << endl;
        }
};

int main()
{
    vector<Point> pointVec;
    Point a;
    Point b;
    pointVec.push_back(a);
    pointVec.push_back(b);

    cout<<pointVec.size()<<std::endl;

    return 0;
}
STL中vector的内存分配与正确释放

输出结果:
STL中vector的内存分配与正确释放

其中执行

pointVec.push_back(a);

此时vector会申请一个内存空间,并调用拷贝构造函数将a放到vector中

再调用

pointVec.push_back(b);

此时内存不够 需要扩大内存,重新分配内存 这时再调用拷贝构造函数将a拷贝到新的内存,再将b拷入新的内存,同时有人调用Point拷贝构造函数,最后释放原来的内存 此时调用Point的析构函数。

 

2.vector的内存释放

由于vector的内存占用空间只增不减,比如你首先分配了10,000个字节,然后erase掉后面9,999个,留下一个有效元素,但是内存占用仍为10,000个。所有内存空间是在vector析构时候才能被系统回收。empty()用来检测容器是否为空的,clear()可以清空所有元素。但是即使clear(),vector所占用的内存空间依然如故,无法保证内存的回收。

如果需要空间动态缩小,可以考虑使用deque。如果vector,可以用swap()来帮助你释放内存。具体方法如下:

vector<Point>().swap(pointVec); //或者pointVec.swap(vector<Point> ())

标准模板:

template < class T >
void ClearVector( vector< T >& vt ) 
{
    vector< T > vtTemp; 
    veTemp.swap( vt );
}

swap()是交换函数,使vector离开其自身的作用域,从而强制释放vector所占的内存空间,总而言之,释放vector内存最简单的方法是vector<Point>().swap(pointVec)。当时如果pointVec是一个类的成员,不能把vector<Point>().swap(pointVec)写进类的析构函数中,否则会导致double free or corruption (fasttop)的错误,原因可能是重复释放内存。(前面的pointVec.swap(vector<Point> ())用G++编译没有通过)

 

3.其他情况释放内存

如果vector中存放的是指针,那么当vector销毁时,这些指针指向的对象不会被销毁,那么内存就不会被释放。如下面这种情况,vector中的元素时由new操作动态申请出来的对象指针:

#include <vector> 
using namespace std; 

vector<void *> v;

每次new之后调用v.push_back()该指针,在程序退出或者根据需要,用以下代码进行内存的释放:

STL中vector的内存分配与正确释放
for (vector<void *>::iterator it = v.begin(); it != v.end(); it ++) 
    if (NULL != *it) 
    {
        delete *it; 
        *it = NULL;
    }
v.clear();
STL中vector的内存分配与正确释放
=========================================================

正确释放Vector的内存

今天在看微博的时候, 有人提出了一个对于Vector内存泄露的疑问( Link)。

博主采用 Vector存储一些数据,但是发现在执行 clear() 之后内存并没有释放,于是怀疑产生了内存泄露。随后有人回复:

“vector 的 clear 不影响 capacity , 你应该 swap 一个空的 vector。”

开始并不知道回复者在说什么,于是在谷歌上搜索 vector swap clear 发现已经有类似的问题出现了,并且给出了一些解决方案。

原来这样的问题在 《Effective STL》中的“条款17”已经指出了

当vector、string大量插入数据后,即使删除了大量数据(或者全部都删除,即clear) 并没有改变容器的容量(capacity),所以仍然会占用着内存。 为了避免这种情况,我们应该想办法改变容器的容量使之尽可能小的符合当前 数据所需(shrink to fit)

《Effective STL》给出的解决方案是:

1
2
3
4
5
6
7
vector<type> v;
//.... 这里添加许多元素给v
//.... 这里删除v中的许多元素
vector<type>(v).swap(v);
//此时v的容量已经尽可能的符合其当前包含的元素数量
//对于string则可能像下面这样
string(s).swap(s);

为了证明这一点,我写了一个程序,如下:

/////////////////////////////

#include <iostream>
#include <vector>
 
using namespace std;
 
vector <string> v;
char ch;
 
int main ()
{
 
    for(int i=0; i<1000000; i++)
        v.push_back("abcdefghijklmn");
    cin >> ch;
    // 此时检查内存情况 占用54M
 
    v.clear();
    cin >> ch;
    // 此时再次检查, 仍然占用54M
 
    cout << "Vector 的 容量为" << v.capacity() << endl;
    // 此时容量为 1048576
 
    vector<string>(v).swap(v);
 
    cout << "Vector 的 容量为" << v.capacity() << endl;
    // 此时容量为0
    cin >> ch;
    // 检查内存,释放了 10M+ 即为数据内存
    return 0;
}

//////////////////////////////

总结

从这个事情说明,自己对STL的了解还非常的不够 平时对vector的清除都懂得采用 clear 方法。

另一方面 对于STL的设计思想也有些了解,在创建一个vector后 vector的实际容量一般会比给数据要大,这样做应该是避免过多的 重新分配内存吧。

当然,上面这种方法虽然释放了内存,但是同时也增加了拷贝数据的时间消耗。 不过一般需要重新调整容量的情况都是 vector本身元素较少的情况,所以 时间消耗可以忽略不计。

因此建议以后大家都将调用 clear() 改为 swap() 吧。

转:http://www.cnblogs.com/biyeymyhjob/archive/2012/09/12/2674004.html

http://blog.jobbole.com/37700/