poj2778 DNA Sequence AC自动机 dp 矩阵乘法

来源:互联网 发布:错别字检测软件 编辑:程序博客网 时间:2024/06/09 20:19

poj2778 DNA Sequence
题意:求仅有A G C T不含有k(k<=10)个长度为d(d<=10)串的长度为L(L<=2*10^9)的串有多少个%100000
题解:
做完感觉之前对AC自动机理解的还不够透彻。
做完就透彻了?也不一定。
首先 bzoj上有一道和这个差不多 不过是kmp而不是AC自动机
bzoj1009 题解:http://www.cnblogs.com/BLADEVIL/p/3483694.html
讲的很透彻。。
然后这道题 dp[i,j]表示母串前i个匹配到trie树的j号节点的个数
对于每个i dp[i,j]加上A G C T分别可以转移到dp[i+1,x],x是由AC自动机推出的
注意 其他节点可以转移到危险节点 危险节点不能转移到其他节点
危险节点包括什么呢?
比如子串有abcddd和abc
那么前一个串的c也是危险节点。(我tm错这卡一晚上)
发现这个错误 也反映了我对AC自动机的一些没有引起注意的概念
AC自动机 每走到一个节点i 代表找到了i以及f[i]以及f[f[i]]等等……
每个j能转移到x ori.a[x,j]++;最后得出个矩阵 快速幂就好了

#include<iostream>#include<cstdio>#include<cstdlib>#include<queue>#define ll long longusing namespace std;const int L=15,N=105,Mo=100000;struct M{    ll a[N][N];}ori,res,tmp;int f[N],val[N],ch[N][4],sz;queue<int>q;void init(){    memset(f,0,sizeof(f));    memset(val,0,sizeof(val));    memset(ch,0,sizeof(ch));    sz=0;}int idx(char c){    if(c=='A') return 0;    if(c=='G') return 1;    if(c=='C') return 2;    if(c=='T') return 3;}void insert(char *s){    int u=0;    for(int i=0;s[i];i++){        int c=idx(s[i]);        if(!ch[u][c]) ch[u][c]=++sz;        u=ch[u][c];    }    val[u]=1;}void getfail(){    for(int i=0;i<4;i++) if(ch[0][i]) q.push(ch[0][i]);    while(!q.empty()){        int r=q.front();q.pop();        for(int i=0;i<4;i++){            int u=ch[r][i];            if(!u) {ch[r][i]=ch[f[r]][i];continue;}            q.push(u);            int v=f[r];            while(v && !ch[v][i]) v=f[v];            f[u]=ch[v][i];            if(val[f[u]]) val[u]=1;        }    }}M mul(M x,M y){    memset(tmp.a,0,sizeof(tmp.a));    for(int i=0;i<=sz;i++)        for(int j=0;j<=sz;j++)            for(int k=0;k<=sz;k++){                tmp.a[i][j]+=(ll)x.a[i][k]*(ll)y.a[k][j];                tmp.a[i][j]%=Mo;            }    return tmp;}void ksm(int k){    for(int i=0;i<=sz;i++) res.a[i][i]=1;    while(k){        if(k&1)            res=mul(ori,res);        ori=mul(ori,ori);        k>>=1;    }}char s[L];int n,m;ll ans,d[N];int main(){    freopen("in.txt","r",stdin);    freopen("out.txt","w",stdout);    scanf("%d%d\n",&n,&m);    init();    for(int i=1;i<=n;i++) scanf("%s",s),insert(s);    getfail();    for(int i=0;i<=sz;i++)        if(!val[i])            for(int j=0;j<4;j++)                ori.a[ch[i][j]][i]++;    ksm(m-1);    for(int i=0;i<4;i++) d[ch[0][i]]++;    for(int i=0;i<=sz;i++)        if(!val[i]){            for(int j=0;j<=sz;j++){                ans+=(ll)d[j]*(ll)res.a[i][j];                ans%=Mo;            }            //printf("%lld\n",ans);        }    printf("%lld\n",ans);}
0 0
原创粉丝点击