KMP算法：高效字符串匹配的核心

KMP算法（Knuth-Morris-Pratt算法）是一种高效的字符串匹配算法，用于在主串中查找子串的位置。其核心思想是通过预处理子串构建部分匹配表（Partial Match Table），利用已匹配的信息避免不必要的回溯。KMP算法通过预处理子串构建Next数组，利用已匹配信息避免主串回溯，显著提高了字符串匹配效率。其核心在于理解最长公共前后缀的概念及Next数组的构建方法。掌握KMP算法不

谭欣辰

121人浏览 · 2026-04-21 20:43:43

谭欣辰 · 2026-04-21 20:43:43 发布

KMP算法概述

KMP算法（Knuth-Morris-Pratt算法）是一种高效的字符串匹配算法，用于在主串中查找子串的位置。其核心思想是通过预处理子串构建部分匹配表（Partial Match Table），利用已匹配的信息避免不必要的回溯。

传统字符串匹配的缺陷

传统暴力匹配算法（Brute-Force）通过逐个字符比较的方式查找子串。当字符不匹配时，主串指针回溯到起始位置的下一个字符，子串指针重置为0。这种方法的平均时间复杂度为O(n*m)，其中n为主串长度，m为子串长度。

KMP算法的优化思路

KMP算法通过分析子串的重复模式，在匹配失败时利用部分匹配表决定子串的移动距离，避免主串指针的回溯。子串指针根据部分匹配表跳转到特定位置，继续匹配。

部分匹配表（Next数组）

部分匹配表（Next数组）是KMP算法的核心，记录子串中每个位置的最长公共前后缀长度。定义如下：

前缀：从子串开头到某个位置的子串（不包含最后一个字符）。
后缀：从某个位置到子串末尾的子串（不包含第一个字符）。
最长公共前后缀：前缀和后缀中最长的相同部分。

Next数组构建步骤

初始化Next数组，Next[0] = -1，Next[1] = 0。
遍历子串，从第二个字符开始计算每个位置的Next值。
若当前字符与前一个Next值对应的字符相同，Next[i] = Next[i-1] + 1。
若不同，递归比较Next[Next[i-1]]对应的字符，直到匹配或回溯到-1。

Next数组示例

子串"ABABC"的Next数组构建过程：

Next[0] = -1
Next[1] = 0
Next[2]：比较'A'与'B'，不同，Next[2] = 0
Next[3]：比较'A'与'A'，相同，Next[3] = 1
Next[4]：比较'B'与'B'，相同，Next[4] = 2

KMP算法匹配过程

初始化主串指针i和子串指针j为0。
若主串和子串当前字符匹配，i和j同时递增。
若不匹配且j > 0，j跳转到Next[j]。
若不匹配且j = 0，i递增。
重复上述步骤，直到子串完全匹配或主串遍历完成。

KMP算法C++实现

#include <vector>
#include <string>
using namespace std;

vector<int> buildNext(const string& pattern) {
    vector<int> Next(pattern.size(), 0);
    Next[0] = -1;
    int i = 1, j = 0;
    while (i < pattern.size()) {
        if (pattern[i] == pattern[j]) {
            Next[i] = j;
            i++;
            j++;
        } else if (j > 0) {
            j = Next[j - 1] + 1;
        } else {
            Next[i] = -1;
            i++;
        }
    }
    return Next;
}

int kmpSearch(const string& text, const string& pattern) {
    vector<int> Next = buildNext(pattern);
    int i = 0, j = 0;
    while (i < text.size() && j < pattern.size()) {
        if (text[i] == pattern[j]) {
            i++;
            j++;
        } else if (j > 0) {
            j = Next[j - 1] + 1;
        } else {
            i++;
        }
    }
    return j == pattern.size() ? i - j : -1;
}