「POJ 3261」Milk Patterns

题目链接:POJ 3261

农夫 John 发现他的奶牛的产奶量每天都在变化。经过进一步调查,他发现:虽然他不能预知未来的产奶量,但是每天的产奶量有一些规律。

为了进行更严格的研究,他发明了一种复杂的分类方案。他记录下了 $n$ 天内的产奶数据,第 $i$ 个产奶量样本被记录为 $a_i$。他希望找到最长的样本模式,其重复次数至少为 $k$ 次,模式之间可以重叠。

数据范围:$1 \le n \le 2 \times 10 ^ 4$,$0 \le a_i \le 10 ^ 6$,$2 \le k \le n$。


Solution

对于子串重复问题,我们首先想到后缀数组,对序列建立后缀数组并求出 $height$ 数组。

先二分答案把问题转化为判定性问题,接下来把 $height$ 数组进行分组,满足同一组内的 $height$ 都不小于二分长度。如果有任意一组的大小 $\ge k$ 那么就满足条件;否则无解。

时间复杂度:$\mathcal O(n \log n)$。


Code

#include <cstdio>
#include <cstring>
#include <algorithm>

const int N = 2e4 + 5;

int n, k, a[N];

template <int S>
struct SuffixArray {
    static const int N = S << 1;
    int n, m, a[N], sa[N], rk[N], bin[N], tmp[N], height[N];
    void clear() {
        memset(a, 0, sizeof(a));
        memset(sa, 0, sizeof(sa));
        memset(rk, 0, sizeof(rk));
        memset(height, 0, sizeof(height));
    }
    void radixSort() {
        for (int i = 1; i <= m; i++) bin[i] = 0;
        for (int i = 1; i <= n; i++) bin[rk[i]]++;
        for (int i = 1; i <= m; i++) bin[i] += bin[i - 1];
        for (int i = n; i >= 1; i--) sa[bin[rk[tmp[i]]]--] = tmp[i];
    }
    template <class Tp>
    void build(Tp *_a, int _n, int _m) {
        n = _n, m = _m;
        std::copy(_a + 1, _a + n + 1, a + 1);
        for (int i = 1; i <= n; i++) rk[i] = a[i], tmp[i] = i;
        radixSort();
        for (int l = 1, p = 0; p < n; l <<= 1, m = p) {
            p = 0;
            for (int i = n - l + 1; i <= n; i++) tmp[++p] = i;
            for (int i = 1; i <= n; i++) if (sa[i] > l) tmp[++p] = sa[i] - l;
            radixSort();
            std::swap(rk, tmp);
            p = rk[sa[1]] = 1;
            for (int i = 2; i <= n; i++) {
                rk[sa[i]] = (tmp[sa[i - 1]] == tmp[sa[i]] && tmp[sa[i - 1] + l] == tmp[sa[i] + l]) ? p : ++p;
            }
        }
        for (int i = 1, k = 0; i <= n; i++) {
            k -= (k > 0);
            int j = sa[rk[i] - 1];
            for (; a[i + k] == a[j + k]; k++);
            height[rk[i]] = k;
        }
    }
};

SuffixArray<N> A;

void discretize() {
    static int b[N];
    std::copy(a + 1, a + n + 1, b + 1);
    std::sort(b + 1, b + n + 1);
    int sz = std::unique(b + 1, b + n + 1) - (b + 1);
    for (int i = 1; i <= n; i++) {
        a[i] = std::lower_bound(b + 1, b + sz + 1, a[i]) - b;
    }
}
bool check(int x) {
    int cnt = 0;
    for (int i = 1; i <= n; i++) {
        if (A.height[i] < x) cnt = 1;
        else if (++cnt >= k) return true;
    }
    return false;
}
int main() {
    scanf("%d%d", &n, &k);
    for (int i = 1; i <= n; i++) scanf("%d", &a[i]);
    discretize();
    A.build(a, n, n);
    int l = 0, r = n, ans = 0;
    while (l <= r) {
        int mid = (l + r) >> 1;
        check(mid) ? l = (ans = mid) + 1: r = mid - 1;
    }
    printf("%d\n", ans);
    return 0;
}

发表评论