背景:
还在做
的题目。
最简单的一题了(掌握了用
解决字符串的套路后)。
题目传送门:
https://www.luogu.org/problemnew/show/P3763
题意:
给你一个字符集为
的字符串,需要你在所有的子串中,可以有
次修改机会,求有多少个子串能和另一个字符串匹配。
思路:
还是比较显然的。
前提是你发现字符集为 (DNA的编码为 )。
做法类似于 luogu P4173 残缺的字符串
考虑每一个字符分别处理(反正字符集为 )。
下面以字符
为例,其中
为
的反向取的序列。
构造
,那么当前的
的结果就为以当前字符匹配的冲突的数量(类似于 luogu P4173 残缺的字符串,只不过没有
的影响,因此不需要平方,本质是相同的)。
将
次的结果相加,若当前这一位不大于
,则是合法的子串。
代码:
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
const double pai=acos(-1.0);
struct comp
{
double x,y;
comp(double xx=0,double yy=0):x(xx),y(yy) {}
friend comp operator+(const comp &x,const comp &y) {return comp(x.x+y.x,x.y+y.y);}
friend comp operator-(const comp &x,const comp &y) {return comp(x.x-y.x,x.y-y.y);}
friend comp operator*(const comp &a,const comp &b) {return comp(a.x*b.x-a.y*b.y,a.x*b.y+b.x*a.y);}
}a[500000],b[500000];
int limit,n,m,l,ma,ans;
int r[500000];
char s1[100010],s2[100010];
double f[500010];
const char EXAM[]={0,'A','T','G','C'};
void init()
{
limit=1,l=0;
while(limit<=ma)
limit<<=1,l++;
for(int i=1;i<=limit;i++)
r[i]=((r[i>>1]>>1)|((i&1)<<(l-1))),f[i]=0;
}
void FFT(comp *now,int ty)
{
for(int i=0;i<limit;i++)
if(i<r[i]) swap(now[i],now[r[i]]);
for(int mid=1;mid<limit;mid<<=1)
{
comp wn(cos(pai/mid),ty*sin(pai/mid));
for(int j=0,R=(mid<<1);j<limit;j+=R)
{
comp w(1,0);
for(int k=0;k<mid;k++,w=w*wn)
{
comp x=now[j+k],y=w*now[j+k+mid];
now[j+k]=x+y;
now[j+k+mid]=x-y;
}
}
}
}
int main()
{
int T;
scanf("%d",&T);
while(T--)
{
ans=0;
scanf("%s %s",s1+1,s2+1);
m=strlen(s1+1),n=strlen(s2+1);
ma=n+m;
init();
for(int k=1;k<=4;k++)
{
for(int i=0;i<=limit;i++)
a[i]=(comp){0,0},b[i]=(comp){0,0};
for(int i=1;i<=m;i++)
a[i].x=(double)(s1[m-i+1]==EXAM[k]?0:1);
for(int i=1;i<=n;i++)
b[i].x=(double)(s2[i]==EXAM[k]?1:0);
FFT(a,1);
FFT(b,1);
for(int i=0;i<=limit;i++)
a[i]=a[i]*b[i];
FFT(a,-1);
for(int i=0;i<=limit;i++)
f[i]+=a[i].x/limit;
}
for(int i=n;i<=m;i++)
if(f[i]<=3.001) ans++;
printf("%d\n",ans);
}
}