【玩转c++】vector讲解和模拟底层实现

本期主题:vector的讲解和模拟实现
博客主页: 小峰同学
分享小编的在Linux中学习到的知识和遇到的问题
小编的能力有限,出现错误希望大家不吝赐

  1. vector的介绍及使用

1.1vector的介绍

vector其实就是一个数组的模板 ,存放的数据可以改变而已。
使用:vector<存放的数据类型> 类名称
vector是表示可变大小数组的序列容器。
就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素 进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自 动处理。
与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末 尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list 统一的迭代器和引用更好。

1.2vector的使用

1.2.1. 成员函数

1.2.2. 迭代器

这里和string几乎相同就不一一介绍了。

1.2.3.容量相关

capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。 这个问题经常会考察,不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义 的。vs是PJ版本STL,g++是SGI版本STL。
reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问 题。
resize在开空间的同时还会进行初始化,影响size。

1.2.4.元素访问

注意:
at和[ ]的区别,at发生越界会抛异常,[ ]发生越界直接断言检查
断言检查只在debug版本下才会起作用。relesae版本不起作用。

1.2.5.元素修改

assign:赋值前会先把元数据清空

  1. vector的模拟实现

2.1.常见错误

2.1.1. vector 迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了 封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的 空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用经失效的迭代器, 程序可能会崩溃)。

#include <iostream>
using namespace std;
#include <vector>
int main()
{
 vector<int> v{1,2,3,4,5,6};
 
 auto it = v.begin();
 
 // 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
 // v.resize(100, 8);
 
 // reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
 // v.reserve(100);
 
 // 插入元素期间,可能会引起扩容,而导致原空间被释放
 // v.insert(v.begin(), 0);
 // v.push_back(8);
 
 // 给vector重新赋值,可能会引起底层容量改变
 v.assign(100, 8);
 
 /*
 出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉,
而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的
空间,而引起代码运行时崩溃。
 解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新
赋值即可。
 */
 while(it != v.end())
 {
     cout<< *it << " " ;
     ++it;
 }
 cout<<endl;
 return 0;
}

2.1.2. insert传进去的迭代器出了函数还能用吗?


int main()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    v.push_back(6);
    vector<int>::iterator it = find(v.begin(), v.end(), 4);
    v.insert(it, 100);
    cout << *it << endl;
    return 0;
}
大家觉得这个代码 有问题吗?
在vs2019上运行起来会报出访问异常的问题,这就是insert迭代器失效的问题。
但是在LInux下不会出现问题,因为底层的模拟实现,是的g++做不到这样的检查。但是有时候g++有时候也会出问题,所以统一认为迭代器失效了。

2.1.3. erase删除偶数的问题

先看代码

int main()
{
    zxf::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    v.push_back(6);
    zxf::vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        else
        {
            it++;
        }
    }

    for (auto i : v) {
        cout << i << endl;
    }
    return 0;
}
这个程序在vs2019下绝对报错,但是在Linux下一般只要控制得好不会报错。
注意erase有一个返回值,返回欲删除元素的下一个元素的迭代器。
所以一般要给it重新赋值。一般不使用删除位置的迭代器,要想使用就要更新it。

2.1.4. 用n个m去初始化的时候,vector<int>会出问题。

先看我们实现的代码: 其中的两个构造函数。
vector(size_t n ,const T& val = T())
    :_start(nullptr)
    ,_finish(nullptr)
    ,_end_of_storagr(nullptr)
{
    reserve(n);
    while(n--){
        push_back(val);
    }
}

template <class InputIterator>
vector(InputIterator first, InputIterator last)
    :_start(nullptr)
    , _finish(nullptr)
    , _endofstorage(nullptr)
{
    while (first != last)
    {
        push_back(*first);
        ++first;
    }
}
假如我们现在,是一个vector<int>的数组,初始化的时候 :vector<int> v(5,6) 。5 6是会被识别成int类型。
本意是想用5个6进行初始化的,但是我们发现它把他识别成为了迭代器初始化。
就会出现报错:非法访问的问题。
库里面的改进方法:
可以看到LInux中的g++(SGI版本的stl)使用的是重载多个vector(),但是最后都调用同一个函数。这样就避免了走模板的困扰,就很好的解决了这个问题。

2.1.5.深层次的拷贝问题。

观察代码
void reserve(size_t n)
        {
            if (n > capacity())
            {
                size_t oldsize = size();
                iterator tmp = new T[n];
                if (_start)
                {
                    memmove(tmp, _start, sizeof(T) * oldsize);
                    delete[] _start;
                }
                _finish = tmp + oldsize;
                _start = tmp;//注意这里的顺序,或者提前记录 oldsize的值。
                _end_of_storage = tmp + n;
            }
        }
分析是不是发现没有什么问题?
但是这个代码是不对的,为什么呢?reserve是扩容的意思,但是假设T是一个自定义类型。
比如T == vector<int> ,这个时候tmp开好空间,直接把原空间的值(指向vetor<int>指针)拷贝给tmp数组(vecto<vector<int>>,然后在delete原来的vector<vector<int>>,这个时候vector里面放的是一个自定义类型(vector<int>),就会调用自定义类型的析构函数释放掉原空间,以及原空间内容指向的空间,这个时候tmp的内容指向的空间就被释放了,tmp里面的元素指向的空间被释放了,他就是存了一系列的野指针。就会出问题。
改进
void reserve(size_t n)
        {
            if (n > capacity())
            {
                size_t oldsize = size();
                iterator tmp = new T[n];
                if (_start)
                {
1·                    //memmove(tmp, _start, sizeof(T) * oldsize);
                    for (size_t i = 0; i < oldsize; i++)
                    {
                        tmp[i] = _start[i];
                    }
                    delete[] _start;
                }
                _finish = tmp + oldsize;
                _start = tmp;//注意这里的顺序,或者提前记录 oldsize的值。
                _end_of_storage = tmp + n;
            }

        }
这样的话直接调用赋值重载,就不会涉及到浅拷贝的问题。这样tmp里面元素vector<int>指向的空间就不同了,就很好的解决了这个问题,虽然这样写效率不高但是现在的水平只能这样写。

2.2.源码

直接上源码
vector.h
#pragma once

#include<assert.h>
#include<iostream>

using namespace std;


namespace zxf
{
    template<class T>
    class vector
    {
    public:
        typedef T* iterator;
        typedef const T* const_iterator;

        const_iterator begin()const
        {
            return _start;
        }    
        iterator begin()
        {
            return _start;
        }
        iterator end()
        {
            return _finish;
        }        
        const_iterator end()const
        {
            return _finish;
        }
        size_t size()const
        {
            //return (_finish - _start) / sizeof(T);
            return (_finish - _start);//注意这里对指针的正确理解
        }
        size_t capacity()const
        {
            return _end_of_storage - _start;
        }

        T& operator[](size_t pos)
        {
            //记住断言检查
            assert(pos < size());
            return _start[pos];
        }

        const T& operator[](size_t pos)const
        {
            assert(pos < size());
            return _start[pos];
        }

        vector()
            :_start(nullptr)
            , _finish(nullptr)
            , _end_of_storage(nullptr) {}
        
        ~vector()
        {
            delete[] _start;
            _start = nullptr;
            _finish = nullptr;
            _end_of_storage = nullptr;
        }
        template<class Intput>
        vector(Intput frist, Intput last)
            :_start(nullptr)
            ,_finish(nullptr)
            ,_end_of_storage(nullptr)
        {
            while (frist < last)
            {
                push_back(*frist);
                ++frist;
            }
        }
        //拷贝构造
        vector(const vector<T>& v)
            :_start(nullptr)
            , _finish(nullptr)
            , _end_of_storage(nullptr)
        {
            reserve(v.capacity());
            for (const auto& a : v)//注意这里要加引用
            {
                push_back(a);
            }
            //想一想为何要加引用。
            //
        }


        vector(const vector<T>& v)
            :_start(nullptr)
            , _finish(nullptr)
            , _end_of_storage(nullptr)
        {
            vector<T> tmp(v.begin(), v.end());
            swap(tmp);
        }

        vector<T>& operator=(vector<T> v)
            //这种写法简单
            //如果v1 == v1 不太好
            //但是也不会出错
        {
            swap(v);
            return *this;
        }
        //vector<T>& operator=(const vector<T>& v)
        //{
        //    vector<T> tmp(v.begin(),v.end())
        //    swap(tmp);
        //    return *this;
        //}

        void reserve(size_t n)
        {
            if (n > capacity())
            {
                size_t oldsize = size();
                iterator tmp = new T[n];
                if (_start)
                {
                    //memmove(tmp, _start, sizeof(T) * oldsize);
                    for (size_t i = 0; i < oldsize; i++)
                    {
                        tmp[i] = _start[i];
                    }
                    delete[] _start;
                }
                _finish = tmp + oldsize;
                _start = tmp;//注意这里的顺序,或者提前记录 oldsize的值。
                _end_of_storage = tmp + n;
            }

        }

        void push_back(const T& value)
        {
            if (_end_of_storage ==  _finish)
            {
                size_t newcapacity = _start == nullptr ? 4 : capacity() * 2;
                reserve(newcapacity);
            }

            *_finish = value;
            ++_finish;
        }

        bool empty()
        {
            return _start == _finish;
        }


        void pop_back()
        {
            //注意判断是否为空,不能一直减,
            assert(!empty());
            --_finish;
        }

        void resize(size_t n, T value = T())
        {
            if (n > capacity()){
                reserve(n);
            }
            if (n < size())
            {
                _finish = _start + n;
            }
            else
            {
                while (size() != n)
                {
                    *_finish = value;
                    ++_finish;
                }
            }
        }


        iterator insert(iterator pos, const T& value)
        {
            assert(pos <= _finish);
            assert(pos >= _start);
            size_t p = pos - _start;
            //注意这里迭代器失效的问题
            if (_finish == _end_of_storage)
            {
                size_t  newcapacity = _start == nullptr ? 4 : capacity() * 2;
                reserve(newcapacity);
            }
            pos = _start + p;
            for (iterator i = _finish; i >= pos; i--)
            {
                *(i + 1) = *i;
            }
            *pos = value;
            _finish++;
            return _start;

        }
        void insert(iterator pos, size_t n, const T& val)
        {
            assert(pos <= _finish);
            assert(pos >= _start);
            size_t p = pos - _start;//注意也有迭代器失效问题
            if (_finish + n >= _end_of_storage)
            {
                size_t  newcapacity = capacity() + n+2;
                reserve(newcapacity);
            }
            pos = _start + p;
            for (iterator i = _finish; i >= pos; i--)
            {
                *(i + n) = *i;
            }
            int i = n;
            while (i--)
            {
                *pos = val;
                pos++;
            }  
            _finish += n;

        }
        iterator erase(iterator pos)
        {
            assert(pos <= _finish);
            assert(pos >= _start);
            if (_start != nullptr)
            {
                for (iterator i = pos; i < _finish -1; i++)
                {
                    *i = *(i + 1);
                }
            }
            --_finish;
            return pos;//这里是为了个库里面保持一致
        }

        void swap(vector& v)
        {
            std::swap(_start, v._start);
            std::swap(_finish, v._finish);
            std::swap(_end_of_storage, v._end_of_storage);
        }


        void clear()
        {
            _finish = _start;
        }
        


    private:
        iterator _start;
        iterator _finish;
        iterator _end_of_storage;
    };

}

猜你喜欢

转载自blog.csdn.net/zxf123567/article/details/129281928