哈希(蛤铪)

哈希

——————————18.5.14更新

——————————18.5.15更新 哈希的判断

哈希是神马东西呢。。。。简单来说它是一个函数啦。。。就这么样(好难呀)

哈希的简介

它是将一个复杂的字符串用一个函数将它映射成一个数字的过程。哈希的函数有很多,也很玄学,因为它看起来很容易错,有很多反例,但是它就是不错。它主要用于判断两个字符串是否相等,具体地实现是判断两个字符的哈希函数的值是否一样即可。

哈希的函数

一下函数都是针对一个字符串A的:(其中 p 是质数, l e n 为字符串长度, c n t A i 为该位字符在该字符串中出现次数)

h a s h ( A ) = i = 1 l e n A i p i

h a s h ( A ) = i = 1 l e n A i p l e n i

还有一个特殊的一个函数:
h a s h ( A ) = i = 1 l e n A i p c n t A i

两个字符串的hash值相同,我们就可以认为两个字符串相等。

具体实现哈希的方法

1.取模

首先我们要取两个很棒的质数p,mod,p表示哈希函数中的p,mod是hash函数的取模(因为哈希函数的值十分大,取模才能比较大小,而且mod比p的选取更加重要)
这里介绍几个很棒的质数:(mod=1234321237,998244353)(p=1e9+7,1e9+9)
代码:

long long hash[maxn],p,mod;//longlong避免溢出 
void gethash(string a){
    int i,len=a.length();
    hsh[0]=a[0];
    for(i=1;i<len;i++)
        hsh[i]=((hsh[i-1]*p)%mod+a[i])%mod;//计算从首位到该位构成的子串的hash值 
}

2.自然溢出(稍微比取模好)

运用longlong有上限的功能,将hash值模longlong的上限,常数更小。(要用到unsigned long long,因为它取不到负数)
代码:

unsigned long long hash[maxn],p;//unsigned long long 取不到负数 
void gethash(string a){
    int i,len=a.length();
    hsh[0]=a[0];
    for(i=1;i<len;i++)
        hsh[i]=hsh[i-1]*pa[i];//计算从首位到该位构成的子串的hash值 
}

哈希的技巧

1. O 1 计算A中A[l]至A[r]的hash值

想一想我们之前算出的hash值储存方式中每个数组的值是什么?:

h a s h ( k ) = i = 1 k a i p l e n i

h a s h ( l , r ) = i = l r a i p r i = i = 1 r a i p r i i = 1 l a i p l i p r l

可推得:
h a s h ( l , r ) = h a s h r h a s h ( l 1 ) p r l

而p的次幂可以数组预处理储存,就 O 1 计算了。在线计算是 O l o g n
当然,也可以推得前面另一种hash函数的A[l]-A[r]的值,不过要求出逆元,要复杂一些( 玄学出错)。

2.双哈希

有些题的数据很强,哈希很容易被卡(哈希很玄学),所以要用到它。顾名思义,即蛤两次,比较两个hash值的大小即可。注意两个hash函数的mod必须不一样。

这些就是hash的内容了,以后应该会更哈希树的内容。

猜你喜欢

转载自blog.csdn.net/qq_42013837/article/details/80325526