【说明】
某初创企业的主营业务是为用户提供高度个性化的商品订购业务,其业务系统支持 PC 端、手机 App 等多种访问方式。系统上线后受到用户普遍欢迎,在线用户数和订单数量迅速增长,原有的关系数据库服务器不能满足高速并发的业务要求。
为了减轻数据库服务器的压力,该企业采用了分布式缓存系统,将应用系统经常使用的数据放置在内存,降低对数据库服务器的查询请求,提高了系统性能。在使用缓存系统的过程中,企业碰到了一系列技术问题。
【问题1】
该系统使用过程中,由于同样的数据分别存在于数据库和缓存系统中,必然会造成数据同步或数据不一致性的问题。该企业团队为解决这个问题,提出了如下解决思路:应用程序读数据时,首先读缓存,当该数据不在缓存时,再读取数据库;应用程序写数据时,先写缓存,成功后再写数据库;或者先写数据库,再写缓存。
王工认为该解决思路并未解决数据同步或数据不一致性的问题,请用 100 字以内的文字解释其原因。
王工给出了一种可以解决该问题的数据读写步骤如下:
读数据操作的基本步骤:
1.根据 key 都缓存;
2.读取成功则直接返回;
3.若 key 不在缓存中时,根据 key(a);
4.读取成功后,(b);
5.成功返回。
写数据操作的基本步骤:
1.根据 key 值写(c);
2.成功后(d);
3.成功返回。
请填写完善上述步骤中(a)~(d)处的空白内容。
答案:
存在双写不一致问题,在写数据时,可能存在缓存写成功,数据库写失败,或者反之,从而造成数据不一致。当多个请求发生时,也可能产生读写冲突的并发问题。
(a)从数据库中读取数据或读数据库
(b)更新缓存中 key 值或更新缓存
(c)数据库
(d)删除缓存 key 或使缓存 key 失效或更新缓存(key 值)
【问题2】
缓存系统一般以 key/value 形式存储数据,在系统运维中发现,部分针对缓存的查询,未在缓存系统中找到对应的 key,从而引发了大量对数据库服务器的查询请求,最严重时甚至导致了数据库服务器的宕机。
经过运维人员的深入分析,发现存在两种情况:
(1)用户请求的 key 值在系统中不存在时,会查询数据库系统,加大了数据库服务器的压力;
(2)系统运行期间,发生了黑客工具,以大量系统不存在的随机 key 发起了查询请求,从而导致了数据库服务器的宕机。
经过研究,研发团队决定,当在数据库中也未查找到该 key 时,在缓存系统中为 key 设置空值,防止对数据库服务器发起重复查询。
请用 100 字以内文字说明该设置空值方案存在的问题,并给出解决思路。
答案:
存在问题:不在系统中的 key 值是无限的,如果均设置 key 值为空,会造成内存资源的极大浪费,引起性能急剧下降。
解决思路:查询缓存之前,对 key 值进行过滤,只允许系统中存在的 key 进行后续操作(例如采用 key 的 bitmap 进行过滤)。
【问题3】
缓存系统中的 key 一般会存在有效期,超过有效期则 key 失效;有时也会根据 LRU 算法将某些 key 移除内存。当应用软件查询 key 时,如 key 失效或不在内存,会重新读取数据库,并更新缓存中的 key。
运维团队发现在某些情况下,若大量的 key 设置了相同的失效时间,或者缓存系统重启等原因,都会造成数据库服务器请求瞬间爆量,引出大量缓存更新操作,导致整个系统性能极具下降,进而造成整个系统崩溃。
请用 100 字以内文字,给出解决该问题的两种不同思路。
答案:
思路1:缓存失效后,通过加排他锁或者队列方式控制数据库写缓存的线程数量,使得缓存更新串行化;
思路2:给不同 key 设置随机或不同的失效时间,使失效时间的分布尽量均匀;
思路3:设置两级或多级缓存,避免访问数据库服务器。
整理完毕,完结撒花~