哈希
——————————18.5.14更新
——————————18.5.15更新 哈希的判断
哈希是神马东西呢。。。。简单来说它是一个函数啦。。。就这么样(好难呀)
哈希的简介
它是将一个复杂的字符串用一个函数将它映射成一个数字的过程。哈希的函数有很多,也很玄学,因为它看起来很容易错,有很多反例,但是它就是不错。它主要用于判断两个字符串是否相等,具体地实现是判断两个字符的哈希函数的值是否一样即可。
哈希的函数
一下函数都是针对一个字符串A的:(其中 是质数, 为字符串长度, 为该位字符在该字符串中出现次数)
还有一个特殊的一个函数:
两个字符串的hash值相同,我们就可以认为两个字符串相等。
具体实现哈希的方法
1.取模
首先我们要取两个很棒的质数p,mod,p表示哈希函数中的p,mod是hash函数的取模(因为哈希函数的值十分大,取模才能比较大小,而且mod比p的选取更加重要)
这里介绍几个很棒的质数:(mod=1234321237,998244353)(p=1e9+7,1e9+9)
代码:
long long hash[maxn],p,mod;//longlong避免溢出
void gethash(string a){
int i,len=a.length();
hsh[0]=a[0];
for(i=1;i<len;i++)
hsh[i]=((hsh[i-1]*p)%mod+a[i])%mod;//计算从首位到该位构成的子串的hash值
}
2.自然溢出(稍微比取模好)
运用longlong有上限的功能,将hash值模longlong的上限,常数更小。(要用到unsigned long long,因为它取不到负数)
代码:
unsigned long long hash[maxn],p;//unsigned long long 取不到负数
void gethash(string a){
int i,len=a.length();
hsh[0]=a[0];
for(i=1;i<len;i++)
hsh[i]=hsh[i-1]*pa[i];//计算从首位到该位构成的子串的hash值
}
哈希的技巧
1. 计算A中A[l]至A[r]的hash值
想一想我们之前算出的hash值储存方式中每个数组的值是什么?:
可推得:
而p的次幂可以数组预处理储存,就 计算了。在线计算是 的
当然,也可以推得前面另一种hash函数的A[l]-A[r]的值,不过要求出逆元,要复杂一些(
2.双哈希
有些题的数据很强,哈希很容易被卡(哈希很玄学),所以要用到它。顾名思义,即蛤两次,比较两个hash值的大小即可。注意两个hash函数的mod必须不一样。