Redis简介
许多网站在海量用户访问的高并发情况下出现崩溃问题,根本原因是关系型数据库。
关系型数据库的缺点
- 性能瓶颈:磁盘IO性能低下
- 扩展瓶颈:数据关系复杂,扩展性差,不便于大规模集群
解决思路(NoSQL)
- 降低磁盘IO次数——内存存储
- 去除数据间关系——不存储关系,仅存储数据
NoSQL
即Not-Only SQL(泛指非关系型数据库),作为关系型数据库的补充
作用:应对基于海量用户和海量数据前提下的数据处理问题
特征:
- 可扩容,可伸缩
- 大数据量下高性能
- 灵活的数据模型
- 高可用
常见的NoSQL数据库:
- Redis
- memcache
- HBase
- MongoDB
解决方案(电商场景)
Redis
概念:
Redis (REmote DIctionary Server) 是用 C 语言开发的一个开源的高性能键值对(key-value)数据库。
特征:
-
数据间没有必然的关联关系
-
内部采用单线程机制进行工作
-
高性能。官方提供测试数据,50个并发执行100000 个请求,读的速度是110000 次/s,写的速度是81000次/s。
-
多数据类型支持
- 字符串类型 string
- 列表类型 list
- 散列类型 hash
- 集合类型 set
- 有序集合类型 sorted_set
-
持久化支持。可以进行数据灾难恢复
Redis的应用
- 为热点数据加速查询(主要场景),如热点商品、热点新闻、热点资讯、推广类等高访问量信息等
- 任务队列,如秒杀、抢购、购票排队等
- 即时信息查询,如各位排行榜、各类网站访问统计、公交到站信息、在线人数信息(聊天室、网站)、设 备信号等
- 时效性信息控制,如验证码控制、投票控制等
- 分布式数据共享,如分布式集群架构中的 session 分离
- 消息队列
- 分布式锁
Redis的下载和安装
Linux版(适用于企业级开发)
- Redis高级使用
- 以4.0为主版本
Windows版本(适合零基础学习)
- Redis入门使用
- 以3.2为主版本
- 下载地址:Redis下载地址
解压后如图:
如果双击redis-server闪退,新建一个start.bat文件,写入redis-server.exe redis.windows.conf
即可
然后双击start.bat即可启动。
Redis的基本操作
信息添加
语法:set key value
信息获取
语法:get key
,若不存在返回nil
清理屏幕
语法:clear
获取帮助
语法: help 指令名
退出客户端
命令:exit
或 quit
或 esc键
数据类型
redis 数据存储格式
redis 自身是一个 Map,其中所有的数据都是采用 key : value 的形式存储
数据类型指的是存储的数据的类型,也就是 value 部分的类型,key 部分永远都是字符串
String
- 存储的数据:单个数据,最简单的数据存储类型,也是最常用的数据存储类型
- 存储数据的格式:一个存储空间保存一个数据
- 存储内容:通常使用字符串,如果字符串以整数的形式展示,可以作为数字操作使用
基本操作
-
添加/修改数据
set key value
-
获取数据
get key
-
删除数据
del key
-
添加/修改多个数据
mset key1 value1 key2 value2 ...
-
获取多个数据
mget key1 key2 …
-
获取数据字符个数(字符串长度)
strlen key
-
追加信息到原始信息后部(如果原始信息存在就追加,否则新建)
append key value
-
示例:
扩展操作
业务场景1
大型企业级应用中,分表操作是基本操作,使用多张表存储同类型数据,但是对应的主键 id 必须保证统一性 ,不能重复。
Oracle 数据库具有sequence 设定,可以解决该问题,但是 MySQL数据库并不具有类似的机 制,那么如何解决?
解决方案
- 设置数值数据增加指定范围的值
incr key
incrby key increment
incrbyfloat key increment
- 设置数值数据减少指定范围的值
decr key
decrby key increment
string 作为数值操作
- string在redis内部存储默认就是一个字符串,当遇到增减类操作incr,decr时会转成数值型进行计算。
- redis所有的操作都是原子性的,采用单线程处理所有业务,命令是一个一个执行的,因此无需考虑并发 带来的数据影响。
- 注意:按数值进行操作的数据,如果原始数据不能转成数值,或超越了redis 数值上限范围,将报错。 9223372036854775807(java中long型数据最大值,Long.MAX_VALUE)
Tips 1:
- redis用于控制数据库表主键id,为数据库表主键提供生成策略,保障数据库表的主键唯一性
- 此方案适用于所有数据库,且支持数据库集群
业务场景2
“最强女生”启动海选投票,只能通过微信投票,每个微信号每 4 小时只能投1票。
电商商家开启热门商品推荐,热门商品不能一直处于热门期,每种商品热门期维持3天,3天后自动取消热门。
新闻网站会出现热点新闻,热点新闻最大的特征是时效性,如何自动控制热点新闻的时效性。
解决方案
- 设置数据具有指定的生命周期
setex key seconds value
有效时间以秒为单位
psetex key milliseconds value
有效时间以毫秒为单位
Tips 2:
redis 控制数据的生命周期,通过数据是否失效控制业务行为,适用于所有具有时效性限定控制的操作
注意事项
数据操作不成功的反馈与数据正常操作之间的差异
① 表示运行结果是否成功
- (integer) 0 → false 失败
- (integer) 1 → true 成功
② 表示运行结果值
- (integer) 3 → 3 3个
- (integer) 1 → 1 1个
数据未获取到
(nil)等同于null
数据最大存储量
512MB
数值计算最大范围(java中的long的最大值)
9223372036854775807
业务场景3
主页高频访问信息显示控制,例如新浪微博大V主页显示粉丝数与微博数量
解决方案
- 在redis中为大V用户设定用户信息,以用户主键和属性值作为key,后台设定定时刷新策略即可
- 在redis中以json格式存储大V用户信息,定时刷新(也可以使用hash类型)
Tips 3:
redis应用于各种结构型和非结构型高热度数据访问加速
key的设置约定
Hash
- 新的存储需求:对一系列存储的数据进行编组,方便管理,典型应用存储对象信息
- 需要的存储结构:一个存储空间保存多个键值对数据
- hash类型:底层使用哈希表结构实现数据存储
hash存储结构优化
- 如果field数量较少,存储结构优化为类数组结构
- 如果field数量较多,存储结构使用HashMap结构
基本操作
- 添加/修改数据
hset key field value
- 获取数据
hget key field
hgetall key
- 删除数据
hdel key field1 [field2]
- 添加/修改多个数据
hmset key field1 value1 field2 value2 …
- 获取多个数据
hmget key field1 field2 …
- 获取哈希表中字段的数量
hlen key
- 获取哈希表中是否存在指定的字段
hexists key field
扩展操作
- 获取哈希表中所有的字段名或字段值
hkeys key
hvals key
- 设置指定字段的数值数据增加指定范围的值
hincrby key field increment
hincrbyfloat key field increment
注意事项
- hash类型下的value只能存储字符串,不允许存储其他数据类型,不存在嵌套现象。如果数据未获取到, 对应的值为(nil)
- 每个 hash 可以存储 2^32 - 1 个键值对
- hash类型十分贴近对象的数据存储形式,并且可以灵活添加删除对象属性。但hash设计初衷不是为了存 储大量对象而设计的,切记不可滥用,更不可以将hash作为对象列表使用
- hgetall 操作可以获取全部属性,如果内部field过多,遍历整体数据效率就很会低,有可能成为数据访问 瓶颈
业务场景
电商网站购物车设计与实现
解决方案
- 以客户id作为key,每位客户创建一个hash存储结构存储对应的购物车信息
- 将商品编号作为field,购买数量作为value进行存储
- 添加商品:追加全新的field与value
- 浏览:遍历hash
- 更改数量:自增/自减,设置value值 删除商品:删除field
- 清空:删除key
当前仅仅是将数据存储到了redis中,并没有起到加速的作用,商品信息还需要二次查询数据库
- 每条购物车中的商品记录保存成两条field
- field1专用于保存购买数量 命名格式:商品id:nums 保存数据:数值
- field2专用于保存购物车中显示的信息,包含文字描述,图片地址,所属商家信息等 命名格式:商品id:info 保存数据:json 独立hash
hsetnx key field value
不存在时添加,存在时不可修改
业务场景
双11活动日,销售手机充值卡的商家对移动、联通、电信的30元、50元、100元商品推出抢购活动,每种商
品抢购上限1000张
解决方案
- 以商家id作为key
- 将参与抢购的商品id作为field
- 将参与抢购的商品数量作为对应的value
- 抢购时使用降值的方式控制产品数量
Tips 5:
redis 应用于抢购,限购类、限量发放优惠卷、激活码等业务的数据存储设计
业务场景
string存储对象(json)适用读操作多场景
hash存储对象 适用写操作多场景
List
- 数据存储需求:存储多个数据,并对数据进入存储空间的顺序进行区分
- 需要的存储结构:一个存储空间保存多个数据,且通过数据可以体现进入顺序
- list类型:保存多个数据,底层使用双向链表存储结构实现
基本操作
- 添加/修改数据
lpush key value1 [value2] ……
rpush key value1 [value2] ……
- 获取数据
lrange key start stop
lindex key index
llen key
- 获取并移除数据
lpop key
rpop key
扩展操作
规定时间内获取并移除数据
blpop key1 [key2] timeout
brpop key1 [key2] timeout
如果list为空时,可等待一段时间,如果该时间段内有了数据依然可获取
设置等待时间60s,list为空时等待获取
添加一个数据到list中,获取成功,用时14.4s
业务场景
微信朋友圈点赞,要求按照点赞顺序显示点赞好友信息
如果取消点赞,移除对应好友信息
移除list中的某个数据:
解决方案
- 移除指定数据
lrem key count value
Tips 6:
redis 应用于具有操作先后顺序的数据控制
注意事项
- list中保存的数据都是string类型的,数据总容量是有限的,最多2^32- 1 个元素(4294967295)。
- list具有索引的概念,但是操作数据时通常以队列的形式进行入队出队操作,或以栈的形式进行入栈出栈操作
- 获取全部数据操作结束索引设置为-1
- list可以对数据进行分页操作,通常第一页的信息来自于list,第2页及更多的信息通过数据库的形式加载
业务场景
twitter、新浪微博、腾讯微博中个人用户的关注列表需要按照用户的关注顺序进行展示,粉丝列表需要将最
近关注的粉丝列在前面
新闻、资讯类网站如何将最新的新闻或资讯按照发生的时间顺序展示?
企业运营过程中,系统将产生出大量的运营数据,如何保障多台服务器操作日志的统一顺序输出?
解决方案
- 依赖list的数据具有顺序的特征对信息进行管理
- 使用队列模型解决多路信息汇总合并的问题
- 使用栈模型解决最新消息的问题
Tips 7:
redis 应用于最新消息展示
Set
- 新的存储需求:存储大量的数据,在查询方面提供更高的效率
- 需要的存储结构:能够保存大量的数据,高效的内部存储机制,便于查询
- set类型:与hash存储结构完全相同,仅存储键,不存储值(nil),并且值是不允许重复的
基本操作
- 添加数据
sadd key member1 [member2]
- 获取全部数据
smembers key
- 删除数据
srem key member1 [member2]
- 获取集合数据总量
scard key
- 判断集合中是否包含指定数据
sismember key member
扩展操作
业务场景
每位用户首次使用今日头条时会设置3项爱好的内容,但是后期为了增加用户的活跃度、兴趣点,必须让用户
对其他信息类别逐渐产生兴趣,增加客户留存度,如何实现?
业务分析
- 系统分析出各个分类的最新或最热点信息条目并组织成set集合
- 随机挑选其中部分信息
- 配合用户关注信息分类中的热点信息组织成展示的全信息集合
解决方案
- 随机获取集合中指定数量的数据
srandmember key [count]
- 随机获取集合中的某个数据并将该数据移出集合
spop key [count]
Tips 8:
redis 应用于随机推荐类信息检索,例如热点歌单推荐,热点新闻推荐,热卖旅游线路,应用APP推荐,大V推荐等
业务场景
- 脉脉为了促进用户间的交流,保障业务成单率的提升,需要让每位用户拥有大量的好友,事实上职场新人不具有更多的职场好友,如何快速为用户积累更多的好友?
- 新浪微博为了增加用户热度,提高用户留存性,需要微博用户在关注更多的人,以此获得更多的信息或热门 话题,如何提高用户关注他人的总量?
- QQ新用户入网年龄越来越低,这些用户的朋友圈交际圈非常小,往往集中在一所学校甚至一个班级中,如何 帮助用户快速积累好友用户带来更多的活跃度?
- 微信公众号是微信信息流通的渠道之一,增加用户关注的公众号成为提高用户活跃度的一种方式,如何帮助 用户积累更多关注的公众号?
- 美团外卖为了提升成单量,必须帮助用户挖掘美食需求,如何推荐给用户最适合自己的美食?
解决方案
- 求两个集合的交、并、差集
sinter key1 [key2]
sunion key1 [key2]
sdiff key1 [key2]
- 求两个集合的交、并、差集并存储到指定集合中
sinterstore destination key1 [key2]
sunionstore destination key1 [key2]
sdiffstore destination key1 [key2]
- 将指定数据从原始集合中移动到目标集合中
smove source destination member
Tips 9:
- redis 应用于同类信息的关联搜索,二度关联搜索,深度关联搜索
- 显示共同关注(一度)
- 显示共同好友(一度)
- 由用户A出发,获取到好友用户B的好友信息列表(一度)
- 由用户A出发,获取到好友用户B的购物清单列表(二度)
-由用户A出发,获取到好友用户B的游戏充值列表(二度)
注意事项
set 类型数据操作的注意事项
- set 类型不允许数据重复,如果添加的数据在 set 中已经存在,将只保留一份
- set 虽然与hash的存储结构相同,但是无法启用hash中存储值的空间
业务场景
集团公司共具有12000名员工,内部OA系统中具有700多个角色,3000多个业务操作,23000多种数据,每位员工具有一个或多个角色,如何快速进行业务操作的权限校验?
将有重复权限的角色集中到一个上:
业务场景
公司对旗下新的网站做推广,统计网站的PV(访问量),UV(独立访客),IP(独立IP)。
PV:网站被访问次数,可通过刷新页面提高访问量
UV:网站被不同用户访问的次数,可通过cookie统计访问量,相同用户切换IP地址,UV不变
IP:网站被不同IP地址访问的总次数,可通过IP地址统计访问量,相同IP不同用户访问,IP不变
解决方案
- 利用set集合的数据去重特征,记录各种访问数据
- 建立string类型数据,利用incr统计日访问量(PV)
- 建立set模型,记录不同cookie数量(UV)
- 建立set模型,记录不同IP数量(IP)
Tips 11:
redis 应用于同类型数据的快速去重
业务场景
黑名单
资讯类信息类网站追求高访问量,但是由于其信息的价值,往往容易被不法分子利用,通过爬虫技术,快速获取信息,个别特种行业网站信息通过爬虫获取分析后,可以转换成商业机密进行出售。例如第三方火车票、机票、酒店刷票代购软件,电商刷评论、刷好评。
同时爬虫带来的伪流量也会给经营者带来错觉,产生错误的决策,有效避免网站被爬虫反复爬取成为每个网站都要考虑的基本问题。在基于技术层面区分出爬虫用户后,需要将此类用户进行有效的屏蔽,这就是 黑名单的典型应用。
ps:不是说爬虫一定做摧毁性的工作,有些小型网站需要爬虫为其带来一些流量。
白名单
对于安全性更高的应用访问,仅仅靠黑名单是不能解决安全问题的,此时需要设定可访问的用户群体, 依赖白名单做更为苛刻的访问验证。
解决方案
- 基于经营战略设定问题用户发现、鉴别规则
- 周期性更新满足规则的用户黑名单,加入set集合
- 用户行为信息达到后与黑名单进行比对,确认行为去向
- 黑名单过滤IP地址:应用于开放游客访问权限的信息源
- 黑名单过滤设备信息:应用于限定访问设备的信息源
- 黑名单过滤用户:应用于基于访问权限的信息源
Tips 12:
redis 应用于基于黑名单与白名单设定的服务控制
Sorted_Set
- 新的存储需求:数据排序有利于数据的有效展示,需要提供一种可以根据自身特征进行排序的方式
- 需要的存储结构:新的存储模型,可以保存可排序的数据
- sorted_set类型:在set的存储结构基础上添加可排序字段
基本操作
- 添加数据
zadd key score1 member1 [score2 member2]
- 获取全部数据
zrange key start stop [WITHSCORES]
zrevrange key start stop [WITHSCORES]
- 删除数据
zrem key member [member ...]
- 按条件获取数据
zrangebyscore key min max [WITHSCORES] [LIMIT]
zrevrangebyscore key max min [WITHSCORES]
- 条件删除数据
zremrangebyrank key start stop
zremrangebyscore key min max
注意:
- min与max用于限定搜索查询的条件
- start与stop用于限定查询范围,作用于索引,表示开始和结束索引
- offset与count用于限定查询范围,作用于查询结果,表示开始位置和数据总量
-
获取集合数据总量
zcard key
zcount key min max
-
集合交、并操作(会自动相加score值)
zinterstore destination numkeys key [key ...]
zunionstore destination numkeys key [key ...]
扩展操作
业务场景
票选广东十大杰出青年,各类综艺选秀海选投票
各类资源网站TOP10(电影,歌曲,文档,电商,游戏等)
聊天室活跃度统计
游戏好友亲密度
解决方案
- 获取数据对应的索引(排名)
zrank key member
zrevrank key member
- score值获取与修改
zscore key member
zincrby key increment member
Tips 13:
redis 应用于计数器组合排序功能对应的排名
注意事项
- score保存的数据存储空间是64位,如果是整数范围是-9007199254740992~9007199254740992
- score保存的数据也可以是一个双精度的double值,基于双精度浮点数的特征,可能会丢失精度,使用时候要慎重
- sorted_set 底层存储还是基于set结构的,因此数据不能重复,如果重复添加相同的数据,score值将被反复覆盖,保留最后一次修改的结果
业务场景
基础服务+增值服务类网站会设定各位会员的试用,让用户充分体验会员优势。例如观影试用VIP、游戏
VIP体验、云盘下载体验VIP、数据查看体验VIP。当VIP体验到期后,如果有效管理此类信息。即便对于正式
VIP用户也存在对应的管理方式。
网站会定期开启投票、讨论,限时进行,逾期作废。如何有效管理此类过期信息。
解决方案
- 对于基于时间线限定的任务处理,将处理时间记录为score值,利用排序功能区分处理的先后顺序
- 记录下一个要处理的时间,当到期后处理对应任务,移除redis中的记录,并记录下一个要处理的时间
- 当新任务加入时,判定并更新当前下一个要处理的任务时间
- 为提升sorted_set的性能,通常将任务根据特征存储成若干个sorted_set。例如1小时内,1天内,周内, 月内,季内,年度等,操作时逐级提升,将即将操作的若干个任务纳入到1小时内处理的队列中
- 获取当前系统时间
time
Tips 14:
redis 应用于定时任务执行顺序管理或任务过期管理
通用指令
Key基本操作
- 删除指定key
del key
- 获取key是否存在
exists key
- 获取key的类型
type key
key 扩展操作(时效性控制)
- 为指定key设置有效期
expire key seconds
单位秒
pexpire key milliseconds
单位毫秒
expireat key timestamp
pexpireat key milliseconds-timestamp
- 获取key的有效时间
ttl key
如果key不存在或key失效显示-2,没设置有效期或永久性显示-1
pttl key
- 切换key从时效性转换为永久性
persist key
key 扩展操作(查询模式)
- 查询key
keys pattern
- 查询模式规则
*
匹配任意数量的任意符号
?
配合一个任意符号
[]
匹配一个指定符号
其他操作
- 为key改名
rename key newkey
renamenx key newkey
新名不存在时才可使用
- 对所有key排序
sort
- 其他key通用操作
help @generic
数据库通用操作
key 的重复问题
- key是由程序员定义的
- redis在使用过程中,伴随着操作数据量的增加,会出现大量的数据以及对应的key
- 数据不区分种类、类别混杂在一起,极易出现重复或冲突
解决方案
- redis为每个服务提供有16个数据库,编号从0到15
- 每个数据库之间的数据相互独立
基本操作
- 切换数据库
select index
- 其他操作
quit
退出
ping
测试连通
echo message
输出信息
扩展操作
- 数据移动
move key db
移动到其他数据库 - 数据清除
dbsize
数据个数
flushdb
清除该数据库
flushall
清除所有数据库
Jedis
一种Java语言连接redis的服务
配置
新建一个maven工程,添加依赖
<dependencies>
<dependency>
<groupId>redis.clients</groupId>
<artifactId>jedis</artifactId>
<version>2.9.0</version>
</dependency>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>4.12</version>
</dependency>
</dependencies>
简单示例
打开redis服务端,创建测试类,先后运行test1,test2
@Test
public void test1(){//存放数据
//1.连接
Jedis jedis = new Jedis("127.0.0.1", 6379);
//2.操作
jedis.set("name","james");
//3.关闭
jedis.close();
}
@Test
public void test2(){//存放数据
//1.连接
Jedis jedis = new Jedis("127.0.0.1", 6379);
//2.操作
System.out.println(jedis.get("name"));;
//3.关闭
jedis.close();
}
结果:
案例:服务调用次数控制
人工智能领域的语义识别与自动对话将是未来服务业机器人应答呼叫体系中的重要技术,百度自研用户评
价语义识别服务,免费开放给企业试用,同时训练百度自己的模型。现对试用用户的使用行为进行限速,
限制每个用户每分钟最多发起10次调用
- 案例要求
① 设定A、B、C三个用户
② A用户限制5次/分调用,B用户限制10次/分调用,C用户不限制
public class JedisDeal {
private String type;//用户类型
private int seconds;//有效时间
private int count;//可执行次数
public JedisDeal(String type){
this.type=type;
if(type.equals("普通用户")) {//普通用户1分钟执行5次
seconds = 60;
count = 5;
} else if(type.equals("高级用户")){//高级用户1分钟执行10次
seconds=60;
this.count=10;
}
else//超级用户无限制
this.count=0;
}
void service(){
try (Jedis jedis = new Jedis("127.0.0.1", 6379)) {//连接redis数据库
String user = jedis.get("user:" + type);
if (user == null) {
if(count!=0){//如果不是超级用户 设置有效时间 和 执行次数的限制
//因为redis最大值Long.MAX_VALUE ,减去可执行次数,再让其递增,就限制了可执行次数
//例如初始值MAX-10,执行10次后达到最大值,溢出
jedis.setex("user:" + type, seconds, Long.MAX_VALUE - count + "");
}
else//超级用户 无限制
jedis.set("user:" + type, "0");
} else {
Long incr = jedis.incr("user:" + type);
if(count!=0)
business(count + incr - Long.MAX_VALUE);
else
business(incr);
}
} catch (JedisDataException e) {//说明达到上限
System.out.println(type+"使用次数已达上限,请升级服务");
}
}
private void business(Long time){
System.out.println(type+"第"+time+"次执行");
}
}
class User extends Thread{
private JedisDeal jedisDeal = null;
User(String type){
jedisDeal = new JedisDeal(type);
}
@Override
public void run() {
while (true){
jedisDeal.service();
try {
Thread.sleep(500);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
}
class JedisTest{
public static void main(String[] args) {
//new User("普通用户").start();
//new User("高级用户").start();
new User("超级用户").start();
}
}
运行结果:
- 普通用户最多执行5次
-
高级用户最多执行10次
-
超级用户无限制
Jedis工具类
配置文件:
工具类:
public class JedisUtils {
private static JedisPool jedisPool;//连接池
private static JedisPoolConfig jedisPoolConfig;//连接配置
private static String host;//主机号
private static int port;//端口号
static {
ResourceBundle rb=ResourceBundle.getBundle("jedis");
host = rb.getString("host");
port=Integer.parseInt(rb.getString("port"));
jedisPoolConfig = new JedisPoolConfig();
jedisPool=new JedisPool(jedisPoolConfig,host,port);
}
public static Jedis getJedis(){
return jedisPool.getResource();
}
public static void main(String[] args) {
Jedis jedis = getJedis();
System.out.println(jedis);
}
}
测试结果: