C++标准库体系结构与内核分析

所谓泛型编程(GP, Generic Programming), 就是使用模板为主要工具来编写程序.

而STL(Standard Template Library 标准模板库)是GP最成功的作品

C++标准库的header files 不带.h, 例如 #include <vector>
新式C header files 不带.h, 例如#include <cstdio>
旧式C header files(带有.h)仍然可用, 例如#include <stdio.h>

STL体系结构基础介绍

STL六大部件:

容器(Containers)
分配器(Allocators)
算法(Algorithm)
迭代器(Iterators)
适配器(Adapters)
仿函式(Functors)

#include <iostream>
#include <vector>
#include <algorithm>
#include <functional>

using namespace std;

int main()
{
    int ia[6] = {1, 2, 3, 4, 5, 6};
    vector<int,allocator<int>> v1(ia, ia + 6);

    cout <<   (v1.begin(), v1.end(), not1(bind2nd(less<int>(), 3)));

    return 0;
}

STL的容器基本上都是采用的"前闭后开"区间, 即begin是头, end是尾的最后一个

容器之分类及各种测试

为了选用更高效的容器, 我们需要了解各种容器的特性

两大种类:

Sequence Containers(循序式容器): Array, Vector, Deque, List, Forward-List(数列和链表)
Associative Containers(关联式容器): Set/Multiset, Map/MultiMap(红黑树)
Unordered Containers(不定序式容器): Unordered Set, Unordered map(哈希表)
vector 的内存增长是两倍增长, 而增长这个过程是在另外一个地方开辟空间, 再拷贝过去, 是一个非常缓慢的过程
algorithm中的算法都是全局函数, 可以在调用时显示地指出它是全局函数, 即在函数名前加双冒号: ::find(c.begin(), c.end(), target);, 如果不加双冒号, 编译器也会在当前作用域寻找寻找不到的时候转向去寻找全局函数.
有全局函数sort, 有的容器自带的也有sort, 如果有自带的sort请用自带的
queue和stack的容器底层实现是用deque, 因为deque功能更强大, 所以很多人把它们(stack和queue)称为容器的适配器(Container Adapters)
由于stack和queue的特性, c++不提供他的迭代器, 防止你破坏这个容器的特性
关联式容器multiset/set, 红黑树, 插入慢, 查找快
multimap/map, 红黑树, 和set的区别: 每个节点有两个数据, 一个是值一个是键
在不定序式容器中, 若某一个bucket中的元素数超过了bucket的数量, 则需要重排
multi代表其中的元素可以重复, 没有multi则不可以重复(key和value都重复才重复)

分配器

容器背后需要分配器支持其内存的分配, 你不用写容器已经有了默认的分配器

容器都是标准库规定的
容器都是有模板的且模板有第二参数, 且都有默认分配器
std::allocator在<memory>下, 若要使用其他的allocator, 请自行#include <ext/...>
不建议直接使用分配器, 分配器最好都要搭配容器使用
因为分配器需要free的时候需要指明当初分配多大的内存, 这显然是不人性化的, 不如使用malloc/free或new/delete

常规进行内存分配使用malloc/free时, 除了你定义的size还要有一部分的空间作为cookie, (你需要知道malloc的内存的大小), 最基础的分配器就是调用malloc和free, 但是我们可以想到, 对于一个容器进行malloc时, 并不需要每一个元素都有一个cookie(因为他们的大小总是确定好了的), 可以一下分配一大块, 再在内部切割, 这样可以省下很多内存

这里是一些速通：

list：双向链表，有一个占位的空节点，end指向它，适合增删场景，不支持下标访问
vector：内存中连续，支持下标访问，有capacity和size，一般两倍扩容
array：简单封装，甚至没有构造与析构函数，目的是将数组与stl的一些算法兼容
deque：双端队列，有一个叫做map的成员，是一个T**类型，为控制中心，指向一个个buffer。deque在内存中片段连续，但是由于控制中心的存在，对使用者连续
queue和stack：deque的适配器（底层容器是deque），由于queue和stack的进出是严格有序的，所以内部没有定义迭代器。实际上queue和stack的底层容器是可以自己决定的，queue和stack的底层容器也可以指定为list;stack的底层容器也可以指定为vector，这些容器都实现queue和stack内部用到的方法。就算指定了错误的容器，只要没有调用不支持的方法，仍能编译通过，说明编译器在处理模板是不会进行全面的检查
rb_tree：红黑树的封装，是有序容器，提供了迭代器，但不应该使用迭代器来直接改变元素值，提供了两种插入操作insert_unique和insert_equal
set和multiset：以rb_tree为底层容器，排序的依据是key，set和multiset的key和value保持一致。由于set必须保证key独一无二，所以插入时调用的是rb_tree的insert_unique，在插入重复key时会插入失败，而multiset可以使用insert_equal
map和multimap：类似set与multiset，只是key和value不必保持一致
hashtable：最开始只有53个桶,当元素个数大于桶的个数时,桶的数目扩大为最接近当前桶数两倍的质数,实际上,桶数目的增长顺序被写死在代码里:

cpp static const unsigned long __stl_prime_list[__stl_num_primes] = { 53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593, 49157, 98317, 196613, 393241, 786433, 1572869, 3145739, 6291469, 12582917, 25165843, 50331653, 100663319, 201326611, 402653189, 805306457, 1610612741, 3221225473ul, 4294967291ul};

unordered_set, unordered_multiset, unordered_map, unordered_multimap：用法与不带unordered前缀的类似，只不过底层实现是一个hashtable