出题:众所周知,程序竞赛测试数据越变态越好玩。已知3个字符串会使选手的程序出错,出题者想构造一个超级变态数据同时包含这3个字符串。求该母串最小长度。
4.7华丽地处理字符串
字符串匹配
利用滚动哈希法可以快速预处理出字符串的哈希值以及基数的n次方表。
如果这些字符串有包含关系,则只取母串x,与剩下的第3个串y进行讨论。如果x和y有包含关系,则取母串作为答案。否则答案为x与y的两种拼接xy和yx中的较小者。
如果没有任何包含关系,那么遍历三个字符串的所有拼接方式,取其最小者作为最终答案。
#include <iostream> #include <algorithm> #include <cstring> using namespace std; using ull = unsigned long long; const int MAX_LENGTH = 100000 + 8; const ull B = 100000007ULL; // 哈希的基数 char s[3][MAX_LENGTH]; ull H[3][MAX_LENGTH], // H[i][j] := s_i的长度为j的前缀的哈希值 B_to[MAX_LENGTH] = {1ULL}; // B_to[i] := B^i int id[3] = {0, 1, 2}, len[3]; void init_hash() { for (int i = 0; i < 3; ++i) {// 初始化前缀的哈希值 for (int j = 1; j < len[i] + 1; ++j) { H[i][j] = H[i][j - 1] * B + s[i][j]; } } int n = max(max(len[0], len[1]), len[2]); for (int i = 1; i < n + 1; ++i) { B_to[i] = B_to[i - 1] * B; } } // s[b...b+l)的哈希值 inline ull hash_of(ull *h, int b, int l) { return h[b + l - 1] - h[b - 1] * B_to[l]; } // b是否在a中出现(a是否包含b) bool contain(int a, int b) { if (len[a] < len[b]) return false; ull bh = H[b][len[b]]; // b全长对应的哈希值 for (int i = 1; i + len[b] <= len[a]; ++i) // 对a不断右移一位,更新哈希值并判断 if (hash_of(H[a], i, len[b]) == bh) // a从位置i开始长度为len[b]的子串等于b return true; return false; } // a的后缀和b的前缀相等的最大长度 int overlap(int a, int b) { int ans = 0; for (int i = 1; i <= min(len[a], len[b]); ++i) {// a的长度为i的后缀与b的长度为i的前缀的哈希值是否相等 if (hash_of(H[a], len[a] - i + 1, i) == hash_of(H[b], 1, i)) ans = i; } return ans; } int solve() { int ans = MAX_LENGTH * 3; for (int i = 0; i < 2; ++i) { for (int j = i + 1; j < 3; ++j) { if (contain(i, j) || contain(j, i)) { int x = len[i] > len[j] ? i : j, y = 3 - i - j; // x为母串,y为除母子串外的第三个串 if (contain(x, y) || contain(y, x)) // x和y有包含关系 return max(len[x], len[y]); return len[x] + len[y] - max(overlap(x, y), overlap(y, x)); // x和y拼接起来 } } } do // 无包含关系,只好遍历所有拼接方式 ans = min(ans, len[0] + len[1] + len[2] - overlap(id[0], id[1]) - overlap(id[1], id[2])); while (next_permutation(id, id + 3)); return ans; } int main() { for (int i = 0; i < 3; ++i) { gets(s[i] + 1), len[i] = strlen(s[i] + 1); // 首部预留一个\0,方便递推hash } init_hash(); printf("%d\n", solve()); return 0; }
Reference
这份模板比书上的要好:http://endless.logdown.com/posts/2014/04/15/codeforces-beta-round-25-25e-test-hash