放牧代码和思想
专注自然语言处理、机器学习算法
    Why join the Navy if you can be a pirate?

POJ 1795 DNA Laboratory 题解 《挑战程序设计竞赛》

目录

POJ 1795 DNA Laboratory

DNA拼接:弗兰肯斯坦从尸体里提取了一堆DNA碎片,想拼成字典序最小的整体,于是他找了几个实习生,你就是其中一个。

3.4熟练掌握动态规划

状态压缩DP

首先,如果一个字串包含在另一个母串中,那么这个子串就不必考虑了。然后,到底是拼在串的前面还是后面好呢?不知道,所以都需要试试。怎么保证字典序呢?如果在相等花费情况下拼接两个串,优先选择小的那个串即可。

这里的“都需要试试”指的是枚举状态,注意到一个串连接另一个串的花费(长度的增量,定义为cost[i][j])只取决于串i的尾部和串j的首部,所以光枚举集合的状态还不够,还需要枚举集合构成的串的尾部才行,定义:

D[字串集合][串j] := 集合尾部为j时的累计长度的最小值(也就是花费)

递推关系是:

D[S + j)][j] = min(D[S + j)][j], D[S][i] + cost[i][j])

递推完毕后,最小长度出来了,倒着往前面回溯,并且挑选字典序最小的串拼接在首部就能保证整体的最小字典序(因为字典序中,首部优先级最大)。

#include <iostream>
#include <cstdio>
#include <cstring>
#include <string>
#include <algorithm>

using namespace std;

#define MAX_N   15
#define INF     0x3f3f3f3f

int N;
int cost[MAX_N][MAX_N];                 // 串i连接串j的长度的增量
int D[1 << MAX_N][MAX_N];               // D[字串集合][串j] := 集合尾部为j时的累计长度的最小值(也就是花费)
bool reachable[1 << MAX_N][MAX_N];      // reachable[S][j] := 既定集合(已经拼成固定的序列了)能够拼上j
string piece[MAX_N];                    // 序列

/**
* 更新最小值
*/
template<typename numType>
inline bool update_min(numType &old, const numType &test)
{
    if (old > test)
    {
        old = test;
        return true;
    }
    return false;
}


int main()
{
#ifndef ONLINE_JUDGE
    freopen("in.txt", "r", stdin);
#endif
    int T;
    cin >> T;
    for (int t = 0; t < T; ++t)
    {
        cin >> N;
        for (int i = 0; i < N; ++i)
        {
            cin >> piece[i];
        }

        for (int i = 0; i < N; ++i)
        {
            for (int j = 0; j < N; ++j)
            {
                if (i != j && piece[j].find(piece[i]) != string::npos)
                {
                    piece[i] = piece[j];         // 序列j包含i,只保留母串
                }
            }
        }
        sort(piece, piece + N);
        N = unique(piece, piece + N) - piece;   // 排重

        int length[MAX_N];                      // 做个软cache
        for (int i = 0; i < N; ++i)
        {
            length[i] = piece[i].length();
        }

        // i右连接j
        for (int i = 0; i < N; ++i)
        {
            for (int j = 0; j < N; ++j)
            {
                for (int l = 0; l <= min(length[i], length[j]); ++l)
                {
                    if (piece[i].substr(length[i] - l) == piece[j].substr(0, l))
                    {
                        cost[i][j] = length[j] - l;
                    }
                }
            }
        }

        for (int bit = 0; bit < 1 << N; ++bit)
        {
            memset(D[bit], 0x3f, sizeof(D[bit]));
        }
        for (int i = 0; i < N; ++i)
        {
            D[1 << i][i] = length[i];
        }
        for (int bit = 0; bit < 1 << N; ++bit)
        {
            // 对每一种拼法,尝试拼接下一个串
            for (int i = 0; i < N; ++i)
            {
                if (D[bit][i] != INF)
                {
                    for (int j = 0; j < N; ++j)
                    {
                        if (!((bit >> j) & 1))  // 如果没拼过j,尝试拼接j
                        {
                            update_min(D[bit | (1 << j)][j], D[bit][i] + cost[i][j]);
                        }
                    }
                }
            }
        }

        int bestLength = INF;
        for (int i = 0; i < N; ++i)
        {
            update_min(bestLength, D[(1 << N) - 1][i]);
        }

        memset(reachable, false, sizeof(reachable));
        for (int i = 0; i < N; ++i)
        {
            if (D[(1 << N) - 1][i] == bestLength)
            {
                reachable[(1 << N) - 1][i] = true;
            }
        }

        for (int bit = (1 << N) - 1; bit >= 0; --bit)
        {
            for (int i = 0; i < N; ++i)
            {
                if (reachable[bit][i])
                {
                    for (int j = 0; j < N; ++j)
                    {
                        if (i != j && ((bit >> j) & 1))
                        {
                            reachable[bit & ~(1 << i)][j] |= (D[bit & ~(1 << i)][j] + cost[j][i] == D[bit][i]);
                        }
                    }
                }
            }
        }

        string result = string(1, 'z' + 1);
        int appended = 0, last = -1;
        for (int i = 0; i < N; ++i)
        {
            if (reachable[1 << i][i] && update_min(result, piece[i]))
            {
                last = i;
            }
        }

        appended |= 1 << last;
        for (int _ = 0; _ < N - 1; ++_)
        {
            string tail = string(1, 'z' + 1);
            int key = -1;
            for (int i = 0; i < N; ++i)
            {
                if (!((appended >> i) & 1)) // 如果没有拼上过
                {
                    if (reachable[appended | (1 << i)][i]                                       // 倒着推,上一个状态可达
                            && D[appended][last] + cost[last][i] == D[appended | (1 << i)][i]   // 是最佳路径
                            && update_min(tail, piece[i].substr(length[i] - cost[last][i])))     // 字典序
                    {
                        key = i;
                    }
                }
            }
            last = key;
            appended |= 1 << key;
            result += tail;
        }
        printf("Scenario #%d:\n%s\n\n", t + 1, result.c_str());
    }
#ifndef ONLINE_JUDGE
    fclose(stdin);
#endif
    return 0;
}
13484961 hankcs 1795 Accepted 2656K 3172MS C++ 4882B 2014-09-28 10:06:04

知识共享许可协议 知识共享署名-非商业性使用-相同方式共享码农场 » POJ 1795 DNA Laboratory 题解 《挑战程序设计竞赛》

分享到:更多 ()

评论 欢迎留言

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

我的开源项目

HanLP自然语言处理包基于DoubleArrayTrie的Aho Corasick自动机