MySQL缓存——入门

1.什么是缓存

缓存就是数据交换的缓冲区(称作Cache)。当cpu处理数据时,会首先从缓存中查找需要的数据(如果数据因之前的操作已经读取而被暂缓存其中),如果找到了则直接执行,找不到的话则从内存中找。由于缓存的运行速度比内存快得多,故缓存的作用就是帮助硬件更快地运行。

2.为什么使用缓存

减少计算量,缩短请求流程(减少网络的I/O或者硬盘I/O).

在web世界,每一层都会被缓存

1.底层CPU缓存,磁盘未见系统缓存.

2.应用层Zend虚拟机的变量缓存.

3.数据库层有Table Cache、Thread Cache、Query Cache

等等.

以Mysql缓存举例:

缓存有3个要素:命中率、缓存更新策略、缓存最大数据量.

1.命中率:请求缓存次数和缓存返回结果次数的比例。比例越高,证明缓存的使用率越高.

  Mysql提供一系列Global Status 记录 Query Cache 当前状态:

  Qcache_free_blocks:目前处于空闲状态的Query Cache 中内容block数目.

  Qcache_free_memory:目前处于空闲状态的Query Cache 内存总量.

  Qcache_hits:Query Cache命中次数.

  Qcache_inserts:向Query Cache中插入新的Query Cache次数,也就是没有命中的次数.

  Qcache_lowmem_prunes:当Query Cache内存容量不够,需要从中删除旧的Query Cache以给新Cahce对象使用的次数.

  Qcache_not_cached:没有被Cache的Sql数,包括无法被Cache的Sql以及由于query_cache_type设置而不会被Cache的Sql.

  Qcache_queries_in_cache:目前在Query Cache中的SQL数量.

  Qcache_total_blocks: Query Cache中的block数量.

2.缓存更新策略:

   在Mysql中,可以设置Query Cache所使用的总内存,MySQL会把默认可以进行缓存的SQL语句的结果集进行缓存,一旦内存塞满后,就会剔除老的Query Cache对象。同时为了保证Query Cache中的内容与是实际数据绝对一致,当表中的数据有任何变化,包括新增、修改、删除等,都会使所有引用到该表的SQL的Query Cache 失效.

   一般把缓存更新策略归纳为以下几种:

  FIFO:最先进入缓存得数据在缓存空间不够情况下(超出最大元素限制时)会被首先清理出去.

  LFU:最少使用的元素会被清理掉.这要求缓存的元素有hit属性,在缓存空间不够的情况下,hit值最小的将会被请出缓存.

  LRU:最近最少使用的元素被清理.缓存的元素有一个时间戳,当缓存容量满了,而又需要腾出地方缓存新元素时,现有缓存元素中时间戳离当前时间最远的元素将被清出缓存.

MySQL一般使用FIFO策略,队列清除.

3.缓存最大数据量:

     在缓存中能处理元素的最大个数或所能使用的最大存储空间。通常各种缓存机制都会对缓存最大数据量进行限定,可以是固定大小的存储空间,集合个数,或者由操作系统所能分配和处理的存储空间决定.

       MySQL的Query Cache缓存最大数据由query_cache_size参数决定,并且可以修改.而基于内存的Key-Value实施方案Memcached,其缓存最大数据量可使用内存由操作系统决定,默认为64MB,每次最大可申请内存为           2MB;

       超出缓存机制所允许的最大数据量系统会进行相应处理,一般由四种处理方式:

      1.停止缓存服务,所有缓存数据被清空.

      2.拒绝写入,不再对缓存数据进行更新。

      3.根据缓存更新策略清除旧数据。

      4.在方式3基础上,将淘汰的数据备份,腾出新的空间.

疑问:

问题来了,mysql自己有缓存,为何在开发中一般都用redis,memcache,而不用Hibernate或者mybatis等ORM自带的缓存或者mysql数据库本身自带缓存,为何?

首先,对大部分分布式系统来说,缓存不适合用程序实现,比如Java访问数据库时,可以自建HashMap/LinkedHashMap用作缓存,可以用开源缓存类库如EHCache,也可以用Hibernate自带的缓存,但由于负载均衡的关系,多台机器上的这些缓存不便于共享,所以不如Redis、Memcached等集中式的缓存来得方便合高效。

其次,很多大型互联网公司的经验表明,数据库缓存带来的效率提升并不明显。因为更新频繁的表,缓存命中率很低;而指定数据库对哪些表用缓存、哪些表不用缓存,可能难度很大。

再者说,mysql是存在磁盘中,而redis和memcache是存放在内存,哪个的运行速度快,我想不言而喻了,我们做缓存本身就是为了快速响应用户请求。

三者的对比:

1、数据库的缓存,是数据库软件自身进行更新、判断是否能从缓存取数据,不需要开发人员关心,因此绝大部分情况下已经使用了数据库的缓存。
mysql中是查询结果缓存,根据query_cache_type的设置是否使用缓存,query_cache_size设置缓存大小。
oracle中的中缓存有两种,数据块缓存buffer cache,查询结果缓存SQL Result Cache。
2、ORM的缓存要看实现类型,比较简单的是存储在服务器本机的内存中,不能满足集群部署的场景,强行使用会出现访问数据不一致的现象。优点是使用简单,且本机缓存的性能更好。
3、redis和memcache都是分布式缓存,使用场景比较广,缺点是是需要开发的人工更新、查询缓存,不像ORM的缓存是自动更新的,开发起来比较繁琐。有些开发框架会对缓存支持比较好,通过配置可以控制缓存使用、更新方法。

猜你喜欢

转载自blog.csdn.net/weixin_38676357/article/details/82111694