链表【C++数据结构】

本文系统讲解链表指针原理与实现，对比std::list和vector，并深入分析了其在频繁插入/删除场景（如LRU缓存）下的独特性能优势与应用价值。

饭碗的彼岸one

10575人浏览 · 2025-09-15 09:13:48

饭碗的彼岸one · 2025-09-15 09:13:48 发布

在这里插入图片描述

文章目录

如果觉得本文对您有所帮助，请点个赞和关注吧，谢谢！！！你的支持就是我持续更新的最大动力

引言

在数据结构的版图中，数组（以及其在C++中的实现 std::vector）凭借其无可匹敌的 O(1) 随机访问速度，成为了大多数序列存储场景下的首选。这得益于其在内存中绝对连续的布局，如同整齐划一的军阵，通过索引便可瞬时定位。然而，军阵的严整也带来了僵化：在阵列中间插入或移除一名士兵，会导致其后所有士兵的大规模移动，这一 O(n) 的开销在数据频繁变动的场景中是不可接受的。

为了打破这种僵化，链表 (Linked List) 应运而生。它是一种截然不同的线性数据结构，其设计哲学是：放弃物理上的连续性，追求逻辑上的灵活性。 它就像一条由无数独立环节构成的锁链，每个环节（节点）在内存中可以散落各处，通过指针（链条）将彼此串联。

一、指针

链表的核心在于节点（Node）的设计以及它们之间通过指针建立的联系。

1.1 节点 (Node)：链表的基本单元

每个链表都由一系列节点构成。一个节点是承载信息和链接关系的最小独立单元，其内部结构通常分为两部分：

数据域 (Data Field): 存储业务数据，其类型可以是任意的，从基本类型（如 int, double）到复杂的自定义对象。
指针域 (Pointer Field): 存储一个或多个内存地址。这个地址指向链表中的其他节点，从而构建起整个链表的逻辑结构。

1.2 内存中的逻辑链接

要真正理解链表的优势，我们必须剖析其与数组在内存布局上的根本差异。

`std::vector` 的内存布局：物理连续

std::vector 的元素在内存中是紧密相邻、按序排列的。这种布局是其高性能随机访问的基石。

示例：std::vector<int> vec = {10, 20, 30, 40};
假设 vec 的起始地址为 0x1000，且 sizeof(int) 为 4 字节。

内存地址 (Address)	存储内容 (Value)	逻辑索引
`0x1000`	`10`	`vec[0]`
`0x1004`	`20`	`vec[1]`
`0x1008`	`30`	`vec[2]`
`0x100C`	`40`	`vec[3]`

访问 vec[2] 的操作在底层被转换为一次简单的地址计算：起始地址 + 2 * sizeof(int)，即 0x1000 + 8 = 0x1008。这是一个 O(1) 操作。

链表的内存布局：逻辑连续

链表的节点在内存中是离散分布的。它们的位置是任意的，仅通过节点内部的指针来维系逻辑上的顺序。

示例：一个存储 {10, 20, 30} 的单向链表
head 指针指向第一个节点，其地址为 0x5A00。

节点内存地址	数据域 (Data)	指针域 (Next Pointer)
`0x5A00`	`10`	`0x7B20`
`0x7B20`	`20`	`0x2C40`
`0x2C40`	`30`	`nullptr`

访问第三个元素（值为 30）的过程如下：

// 1. 从 head 指针开始，访问第一个节点
Node* current = head; // current = 0x5A00

// 2. 读取第一个节点的 next 指针，跳转到第二个节点
current = current->next; // current = 0x7B20

// 3. 读取第二个节点的 next 指针，跳转到第三个节点
current = current->next; // current = 0x2C40

// 4. 此时 current 指向第三个节点，可以访问其数据
int value = current->data; // value = 30

这个过程必须顺序遍历，因此访问第 N 个元素的时间复杂度是 O(n)。这种“按图索骥”的方式，我们称之为顺序访问。

二、单向链表 (Singly Linked List)

单向链表是链表最基本的形式，每个节点仅有一个指向其直接后继节点的指针。

2.1 结构定义与实现

一个健壮的单向链表实现，除了 head 指针，通常还会维护一个 tail 指针以实现 O(1) 的尾部插入，以及一个 size 成员来追踪元素数量。

#include <iostream>
#include <stdexcept>

template<typename T>
class SinglyLinkedList {
private:
    struct Node {
        T data;
        Node* next;
        Node(const T& val) : data(val), next(nullptr) {}
    };

    Node* head;
    Node* tail;
    size_t count;

public:
    // 构造函数
    SinglyLinkedList() : head(nullptr), tail(nullptr), count(0) {}

    // 析构函数: 必须释放所有节点以防内存泄漏
    ~SinglyLinkedList() {
        Node* current = head;
        while (current != nullptr) {
            Node* next_node = current->next;
            delete current;
            current = next_node;
        }
    }
    
    // ... 其他成员函数 ...
};

2.2 核心操作详解

2.2.1 头部插入 (push_front)

函数作用: 在链表的最前端添加一个新元素。
使用格式: list.push_front(value);
参数含义: value (const T&): 要插入的数据。
返回值: void
时间复杂度: O(1)
实现逻辑:
1. 创建新节点 new_node。
2. 将 new_node 的 next 指针指向当前的 head。
3. 更新 head 指针，使其指向 new_node。
4. 边缘情况: 如果链表原先为空，tail 指针也需要指向 new_node。
5. 增加 count。

void push_front(const T& data) {
    Node* new_node = new Node(data);
    new_node->next = head;
    head = new_node;
    if (tail == nullptr) { // 如果是第一个节点
        tail = head;
    }
    count++;
}

2.2.2 尾部插入 (push_back)

函数作用: 在链表的末尾添加一个新元素。
使用格式: list.push_back(value);
参数含义: value (const T&): 要插入的数据。
返回值: void
时间复杂度: O(1) (因为我们维护了 tail 指针)
实现逻辑:
1. 创建新节点 new_node。
2. 如果链表非空，将当前 tail 节点的 next 指针指向 new_node。
3. 更新 tail 指针为 new_node。
4. 边缘情况: 如果链表原先为空，head 和 tail 都应指向 new_node。
5. 增加 count。

void push_back(const T& data) {
    Node* new_node = new Node(data);
    if (head == nullptr) {
        head = tail = new_node;
    } else {
        tail->next = new_node;
        tail = new_node;
    }
    count++;
}

2.2.3 删除指定值的节点 (erase)

函数作用: 删除链表中第一个值为 key 的节点。
使用格式: list.erase(key);
参数含义: key (const T&): 要删除的节点的数据值。
返回值: void
时间复杂度: O(n) (主要耗时在查找)
实现逻辑:
1. 处理头节点: 如果 head 就是要删除的节点，特殊处理。
2. 查找前驱节点: 从 head 开始遍历，找到待删除节点的前一个节点 prev。
3. 指针跨接: 将 prev->next 指向待删除节点的下一个节点 (temp->next)。
4. 更新tail: 如果删除的是尾节点，需要更新 tail 指针。
5. 释放内存: delete 待删除节点。
6. 减少 count。

void erase(const T& key) {
    if (head == nullptr) return;

    Node* temp = head;
    Node* prev = nullptr;

    // Case 1: 头节点是目标
    if (temp->data == key) {
        head = temp->next;
        if (head == nullptr) { // 如果链表变空
            tail = nullptr;
        }
        delete temp;
        count--;
        return;
    }

    // Case 2: 查找目标节点及其前驱
    while (temp != nullptr && temp->data != key) {
        prev = temp;
        temp = temp->next;
    }

    // 未找到
    if (temp == nullptr) return;

    // Case 3: 找到了，执行删除
    prev->next = temp->next;
    if (prev->next == nullptr) { // 如果删除的是尾节点
        tail = prev;
    }
    delete temp;
    count--;
}

三、双向链表 (Doubly Linked List)

为了解决单向链表在查找前驱节点时的 O(n) 困境，双向链表为每个节点增加了一个 prev 指针，指向其直接前驱。

template<typename T>
struct DNode {
    T data;
    DNode<T>* next;
    DNode<T>* prev;
    DNode(const T& val) : data(val), next(nullptr), prev(nullptr) {}
};

3.1 核心优势

双向遍历: 可从头到尾，亦可从尾到头。
O(1) 删除: 若持有待删除节点的指针，无需遍历即可找到其前后节点，实现常数时间复杂度的删除。
O(1) 插入: 在任意已知节点前后插入新节点均为常数时间复杂度。

3.2 `erase` 操作的蜕变

对比单向链表，双向链表的删除操作（当给定节点指针时）变得极其高效和优雅。

函数作用: 从链表中移除指定的节点。
使用格式: list.erase(node_pointer);
参数含义: node_pointer (DNode<T>*): 指向待删除节点的指针。
返回值: void
时间复杂度: O(1)
实现逻辑:
1. 处理 prev 节点的 next 指针。
2. 处理 next 节点的 prev 指针。
3. 释放目标节点内存。
4. 处理 head 和 tail 的边缘情况。

void erase(DNode<T>* node_to_delete) {
    if (node_to_delete == nullptr) return;

    // 1. "跨接"前驱节点
    if (node_to_delete->prev != nullptr) {
        node_to_delete->prev->next = node_to_delete->next;
    } else { // 删除的是头节点
        head = node_to_delete->next;
    }

    // 2. "跨接"后继节点
    if (node_to_delete->next != nullptr) {
        node_to_delete->next->prev = node_to_delete->prev;
    } else { // 删除的是尾节点
        tail = node_to_delete->prev;
    }

    delete node_to_delete;
    count--;
}

这个 O(1) 的能力是双向链表相对于单向链表最本质的飞跃。

四、C++ STL 中的工业级链表

在实际项目中，我们应优先使用标准库提供的容器，它们经过了严格的测试和性能优化。

4.1 `std::forward_list` (单向) vs `std::list` (双向)

特性	`std::forward_list`	`std::list`
底层结构	单向链表	双向链表
迭代器	`forward_iterator` (只能 `++`)	`bidirectional_iterator` (支持 `++` 和 `--`)
内存开销	极低 (每个节点一个指针)	较高 (每个节点两个指针)
`size()` 方法	无 (获取大小需 O(n) 遍历)	有 (O(1)，C++11后)
特色操作	`insert_after`, `erase_after`	`push_back`, `pop_back`, `splice`

4.2 关键概念：迭代器稳定性

这是链表相较于 std::vector 的一个至关重要的优势。

std::vector: 在中间插入或删除元素，可能导致内存重分配（扩容），这会使所有指向该 vector 的迭代器、指针和引用失效。即使没有重分配，删除点之后的所有迭代器也会失效。
std::list / std::forward_list: 插入操作不会使任何现有迭代器失效。删除操作只会使指向被删除元素的迭代器失效。

这意味着你可以安全地遍历一个 std::list 并在此过程中进行删除或插入操作（只要正确处理当前迭代器），而对 std::vector 做同样的事则充满风险。

4.3 链表的“超能力”：`std::list::splice`

splice 是 std::list 独有的高效操作，它可以在 O(1) 时间内将一个链表中的元素（单个、一段或整个链表）移动到另一个链表中的指定位置。这个过程不涉及任何元素的复制或内存分配，仅仅是修改几个指针的指向。

函数作用: 移动元素，而非复制。
使用格式: list1.splice(position, list2);
参数含义:
- position: list1中的一个迭代器，指示插入点。
- list2: 从中移动元素的源链表。
返回值: void
时间复杂度: O(1)
示例:

#include <list>
#include <iostream>

// ... 
std::list<int> list1 = {1, 5};
std::list<int> list2 = {2, 3, 4};

auto it = list1.begin();
++it; // it 指向 5

// 将 list2 的所有元素移动到 list1 的 it 位置之前
list1.splice(it, list2);

// 最终 list1: {1, 2, 3, 4, 5}
// 最终 list2: {} (变为空)

五、链表的真实使用场景举例

5.1 案例一：实现 LRU Cache (最近最少使用缓存)

LRU Cache 是一个经典的缓存淘汰算法。其核心需求是：

快速查找数据是否存在 (O(1))。
快速将最近访问的数据移到“最新”位置 (O(1))。
快速淘汰最久未使用的数据 (O(1))。

完美解决方案是 哈希表 + 双向链表：

哈希表 (std::unordered_map): 存储 key到链表节点迭代器/指针的映射，实现 O(1) 的查找。
双向链表 (std::list): 维护数据的“热度”。链表头部代表最新访问，尾部代表最久未用。
- 当一个数据被访问（命中），通过哈希表找到其节点，然后利用双向链表的O(1)删除和O(1)头部插入能力（即 splice 操作），将其移动到链表头部。
- 当缓存满需要淘汰时，直接删除链表尾部节点（pop_back）并从哈希表中移除对应条目即可。

5.2 案例二：大型应用中的 Undo/Redo (撤销/重做) 功能

文本编辑器或图像处理软件的 Undo/Redo 功能，需要记录一系列的操作历史。

Undo: 相当于回退到上一个状态。
Redo: 相当于从当前状态前进到下一个状态。

这与双向链表的双向遍历特性完美契合。一个std::list可以存储一系列“操作”对象，一个“当前状态”迭代器在链表中前后移动，即可高效实现撤销和重做功能。在中间插入新的操作（例如，在撤销几次后输入新内容）也远比数组高效。

结语

链表并不是万能的，它以牺牲 O(1) 随机访问为代价，换来了在动态数据集合中无与伦比的 O(1) 插入/删除性能和迭代器稳定性。作为一名开发者，我们的任务不是盲目地选择“最好”的数据结构，而是深入理解每种结构的内在权衡，并根据具体的业务需求、数据规模和操作模式，做出最精准、最合理的决策。当你遇到频繁的、不可预测的序列修改时，请务必将链表纳入你的首选方案之中。

如果觉得本文对您有所帮助，请点个赞和关注吧，谢谢！！！你的支持就是我持续更新的最大动力