从零开始的 STL 实现记录：Container-2.3

前言

相较于 vector 的连续线性空间，list 就显得复杂许多、它的好处是每次插人或删除一个元素，就配置或释放一个元素空间。因此，1ist 对于空间的运用有绝对的精准，一点也不浪费。而且，对于任何位置的元素插入或元素移除，list 永远是常数时间。
———— 《STL源码剖析》侯捷

本篇博客将会分析 STL 中 list 的 sort。值得注意的是，在原始的 MyTinySTL 仓库中，作者 list 部分的实现方式是有些怪异的，包括但不限于：使用了本该出现在 SGI-STL 的 slist 中的 base_ptr 与 node_ptr 来代表 list 的指针、没有实现 transfer 函数、sort 的实现也很繁杂；保险起见，下面的解析均以 SGI-STL 中的实现为准。

sort

在分析 list 的 sort 之前，需要弄清楚一件事情：为什么 list 不能使用 STL 算法中的 sort 函数而是需要在内部设计一个自己的 sort 函数？

很多人以及博客会说：因为 list 维护的并不是一个连续的空间，因此不能使用 STL 的 sort。但实际上，deque 内部也不是连续空间，而是分段式的空间，但 deque 依然可以使用 STL 的 sort。根本原因在于：STL 的 sort 算法只接受 RandomAccessIterator，而 list 的 iterator 为 bidirectionalIterator。因此，list 的排序需要类内部单独实现。

为了实现 sort，需要事先介绍几个 list 中的特殊函数。

transfer & splice & reverse & merge

list 内部提供一个所谓的迁移操作 ( transfer )：将某连续范围的元素迁移到某个特定位置之前。技术上很简单，节点间的指针移动而已，这个操作为其它的复杂操作如 splice， sort，merge 等奠定良好的基础。

void transfer(iterator pos, iterator first, iterator last) {
    if (pos != last) {
        last.node_->prev->next = pos.node_;        // (1) 将 last 之前的节点与 pos 连接
        first.node_->prev->next = last.node_;      // (2) 将 first 之前的节点与 last 连接
        pos.node_->prev->next = first.node_;       // (3) 将 pos 之前的节点与 first 连接
        auto tmp = pos.node_->prev;                // (4) 存储 pos 之前的节点
        pos.node_->prev = last.node_->prev;        // (5) 将 pos 之前的节点与 last 之前的节点连接
        last.node_->prev = first.node_->prev;      // (6) 将 last 之前的节点与 first 之前的节点连接
        first.node_->prev = tmp;                   // (7) 将 first 之前的节点与 pos 之前的节点连接
    }
}

以上每一步的操作示意如下图所示：

上述的 transfer 并非公开接口，list 公开提供的是所谓的接合操作 ( splice )；将某连续范围的元素从一个 list 移动到另一个（或同一个）list 的某个定点。

template <class T, class Alloc = alloc>
class list 
{
    ...
public:
    // 将 x 接合于 position 之前，x 必须不同于 *this
    void splice(iterator position, list& x) {
      if (!x.empty()) 
        transfer(position, x.begin(), x.end());
    }
    // 将 i 所指元素接合于 position 所指位置之前，position 和 i 可指向同一个 list
    void splice(iterator position, list&, iterator i) {
      iterator j = i;
      ++j;
      if (position == i || position == j) return;
      transfer(position, i, j);
    }
    // 将 [first, last) 内的所有元素接合于 position 所指位置之前
    void splice(iterator position, list&, iterator first, iterator last) {
      if (first != last) 
        transfer(position, first, last);
    }
    ...
};

可以看出，splice 提供了多个版本的接口，且内部均调用了 transfer。

merge函数是将传入的list链表x与原链表按从小到大合并到原链表中(前提是两个链表都是已经从小到大排序了)。这里 merge的核心就是 transfer 函数。

template <class T, class Alloc>
void list<T, Alloc>::merge(list<T, Alloc>& x) {
    iterator first1 = begin();
    iterator last1 = end();
    iterator first2 = x.begin();
    iterator last2 = x.end();
    while (first1 != last1 && first2 != last2) {
        if (*first2 < *first1) {
        iterator next = first2;
        // 将first2到first+1的左闭右开区间插入到first1的前面
        // 这就是将first2合并到first1链表中
        transfer(first1, first2, ++next);
        first2 = next;
        }
        else++first1;
    }    
    // 如果链表x还有元素则全部插入到first1链表的尾部
    if (first2 != last2) transfer(last1, first2, last2);
}

reverse函数是实现将链表翻转的功能. ，将每一个元素一个个插入到begin之前，内部也是利用了 transfer。

template <class T, class Alloc>
void list<T, Alloc>::reverse() 
{
  if (node->next == node || link_type(node->next)->next == node) 
  	return;
  iterator first = begin();
  ++first;
  while (first != end()) {
    iterator old = first;
    ++first;
      // 将元素插入到begin()之前
    transfer(begin(), old, first);
  }
}

sort 他来了

在实现 list 的过程中原本以为这个 sort 函数就是一个简单的归并排序，就直接复制粘贴了。直到今天写博客才发现，居然看不懂它的实现，一番分析之后顿时惊为天人！不得不感叹 stl 的魅力，仅用十几行的代码就完成了 链表非递归方式的归并排序。趁我还能看懂，赶紧分析一下这个的实现。

在分析之前，需要讲清楚一些函数的作用：

splice : splice 函数上面已经分析过，将一个链表中的一部分移动到另一个链表的指定位置之前，这里需要注意的是，被移动的部分确确实实的与原始链表断开了连接，并且插入在了新的链表中。
merge : 这个函数上面也进行了分析，将两个有序链表进行合并，由于内部调用的是 transfer，与 splice 相同，如 l1.merge(l2)，那么合并之后 l2 为空，节点全部被合并至 l1。
swap : 这个函数我们没有分析，但不难想象，由于 list 仅有一个成员变量 node（有的版本会有 size），因此只需交换两个链表的对应 node 迭代器就行，l1.swap(l2)相当于将 l1 的全部节点都交给 l2，l2 的全部节点都交给 l1。

下面开始分析这惊为天人的代码。

template <class T>
template <class Compare>
void list<T>::list_sort(Compare comp) {
    if (node_->next == node_ || node_->next->next == node_) return;

    // 一些新的 lists 用于存储分割后的 lists
    list<T> carry;
    list<T> counter[64];  // 缓存表，第 i 层 list 存储长度为 2^i
    int fill = 0;         // 记录最深层数，counter[fill] 为空

    while (!empty()) {
        // 运行到此处 carry 必然为空，因此一定可以处理下一个元素
        // 1. 将当前 list 的头部元素取出，放入 carry 中
        carry.splice(carry.begin(), *this, begin());
        int i = 0;  // 记录经过的层数
        
        // 2. 从小往大不断合并非空层直至遇到空层或者到达当前最大归并层次
        // 出这个循环，无论 i 是否超过最大层，counter[i] 必然是空的
        // !counter[i].empty() 决定了 counter[i] 中存放的 list 的长度为 2^i
        while (i < fill && !counter[i].empty()) {
            // 将 carry 的元素与 counter[i] 的元素按顺序合并
            counter[i].merge(carry, comp);
            // 将合并后的结果放入 carry 中，i + 1，继续下一层的合并
            // 这里使用了一些小技巧，实际上相当于：
            // carry.swap(counter[i]);
            // ++i;
            carry.swap(counter[i++]);
        }

        // 3. 将合并出的结果放入下一层中
        // 根据上面循环的退出条件，count[i]必然是空的，
        // 这里相当于将 carry 中归并的结果放入下一层，由于经过了 swap，因此 carry 必然为空
        carry.swap(counter[i]);

        // 如果 i == fill，说明当前层是最大层，需要增加一层
        if (i == fill) ++fill;
    }

    // 将每一层的 list 依次合并，每一层保证有序
    for (int i = 1; i < fill; ++i) {
        counter[i].merge(counter[i - 1], comp);
    }

    // 将最终的结果交换到当前 list 中
    swap(counter[fill - 1]);
}

首先，如果元素个数小于等于 1，直接返回，这里做特殊处理，没什么好分析的。

1	if (node_->next == node_ \|\| node_->next->next == node_) return;

接着定义了一些用于归并排序的变量。

// 一些新的 lists 用于存储分割后的 lists
list<T> carry;        // 中转站，用于在 counter 之间搬运节点以及从 list 上取下节点
list<T> counter[64];  // 缓存表，第 i 层 list 存储长度为 2^i
int fill = 0;         // 记录最深层数，counter[fill] 为空

其中，carry 负责每次从待排序的 list （以下简称 list）上取下一个节点，并且负责在归并的过程中，在各个 counter 之间搬运节点；counter 为节点的缓存表，用于存放从 list 中取下的节点，缓存表共有 64 层，每一层存放的元素个数符合二进制关系，因此 sort 最多可以处理 2 ^ 64 - 1 个元素；fill 负责维护目前抵达的最深层次，counter[fill] 为空。

下面是一个 while 循环，从条件就可以看出，该算法的做法为每次从 list 上取下一个节点，直到 list 为空即完成了排序。

1	while (!empty())

每次循环都要做三件事~~公平！公平！还是TMD公平！~~：

开始一次归并的流程，从 list 中取出一个点放进 carry，此时 carry 必然为空。同时用变量 i 记录本次归并到达的层数，以用于更新 fill 与跳出循环。

// 运行到此处 carry 必然为空，因此一定可以处理下一个元素
// 1. 将当前 list 的头部元素取出，放入 carry 中
carry.splice(carry.begin(), *this, begin());
int i = 0;  // 记录经过的层数

从第 0 层（i 维护的层数）开始，逐层进行归并。如果当前遍历到的缓存表中（counter[i]）有元素，那么就将 counter[i]中的元素与 carry 合并（由于使用的是 merge，保证了有序性），将这一结果交换（swap）给 carry，并继续处理下一层。

这里一定要注意：正是 !counter[i].empty() 这样的判断条件设计，决定了每一层的 counter 中元素个数均为 2 ^ i，因为如果当前的缓存表 counter[i] 不为空，那么一定是上一轮的归并将元素移到了当前的缓存表中，这一次直接将其与 carry 合并，并放入 counter[i+1]，这不正是二进制的进位操作吗！因此，这样操作下来，counter[i] 中的节点个数必然为 2 ^ i。
同样道理，如果你想设计一个三进制的 counter，只需要将每一层的判断改为 “是否在此之前已经归并了两次” 即可，但是由于二进制的判断最为简单（每个缓存表只有 “空（0）” 与 “满（1）” 两种状态），并且 empty 很容易判断，因此设计成二进制是最合理的。

// 2. 从小往大不断合并非空层直至遇到空层或者到达当前最大归并层次
// 出这个循环，无论 i 是否超过最大层，counter[i] 必然是空的
// !counter[i].empty() 决定了 counter[i] 中存放的 list 的长度为 2^i
while (i < fill && !counter[i].empty()) {
    // 将 carry 的元素与 counter[i] 的元素按顺序合并
    counter[i].merge(carry);
    // 将合并后的结果放入 carry 中，i + 1，继续下一层的合并
    carry.swap(counter[i++]);
}

结合上述循环跳出的条件，当前遍历到的缓存表 counter[i] 必然是空的，因此需要把 carry 中携带的所有节点均放进当前的缓存表中（相当于二进制中将这一位置为 1）。如果下次依然遍历到了这个表，那么就需要进位了。同时，如果当前已经遍历到了最大层，那么就要更新 fill。

// 3. 将合并出的结果放入下一层中
// 根据上面循环的退出条件，count[i]必然是空的，
// 这里相当于将 carry 中归并的结果放入下一层，由于经过了 swap，因此 carry 必然为空
carry.swap(counter[i]);

// 如果 i == fill，说明当前层是最大层，需要增加一层
if (i == fill) ++fill;

跳出了这个外层的循环，就意味着我们已经将链表的节点全部有序地储存在了 counter 中，下面只需要对 counter[0 : fill] 遍历使用 merge 即可完成排序，这里也就不难理解 fill 的设计了，为了方便下面的遍历，并且也满足了 “前闭后开” 的原则。

// 将每一层的 list 依次合并，每一层保证有序
for (int i = 1; i < fill; ++i) {
    counter[i].merge(counter[i - 1], comp);
}

// 将最终的结果交换到当前 list 中
swap(counter[fill - 1]);

最后的 swap(counter[fill - 1]);，是将归并完的结果交换至 list 中，也就完成了排序。

总结

SGI-STL 中的 list 为双向环状链表，只需一个节点便可以遍历整个链表，并且可以轻松维护各种信息（如 begin(), end(), empty() 等）。

相较于 vector，list 的好处是对于任意位置的元素插入与删除，均是常数时间复杂度，且对于空间的使用非常精准，不用像 vector 一样提前分配多余的空间；同时，list 的迭代器也始终有效，不会出现 vector 中的失效情况。但常数时间插入删除元素的代价就是对于任意元素的访问是 O(n) 复杂度。

list 的迭代器为双向迭代器，不支持随机访问，因此也不能使用 STL 中的排序算法对 list 进行排序。为此，list 内部实现了一种十分巧妙的归并排序方法，使用 merge 与 swap 等内部的函数，同时利用了缓存表，实现了时间复杂度 O(nlogn)，空间复杂度 O(n) 的归并排序。