Memcached
Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据 库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信。
在使用Memchched前,先来安装一下,安装环境是Linux服务器:
1
2
3
4
5
6
7
|
wget http:
/
/
memcached.org
/
downloads
/
memcached
-
1.4
.
29.tar
.gz下载最新源码
tar
-
zxvf memcached
-
x.x.x.tar.gz
cd memcached
-
x.x.x
.
/
configure && make && make test && sudo make install
PS:依赖libevent,需要提前安装
yum install libevent
-
devel
apt
-
get install libevent
-
dev
|
启动Memcached
1
2
3
4
5
6
7
|
memcached
-
d
-
m
10
-
u root
-
l
0.0
.
0.0
-
p
12000
-
c
256
-
P
/
tmp
/
memcached.pid<br>
-
d:启动一个守护进程<br>
-
m:分配给Memcache使用的内存数量,单位是MB<br>
-
u :运行Memcache的用户<br>
-
l :监听的服务器IP地址<br>
-
p:设置Memcache监听的端口,最好是
1024
以上的端口<br>
-
c :最大运行的并发连接数,默认是
1024
,按照服务器的负载量来设定<br>
-
P:设置保存Memcache的pid文件
|
1.2 Python操作Memcached
安装API
- python操作Memcached使用Python-memcached模块
- 下载安装:https://pypi.python.org/pypi/python-memcached
操作方法:
set:传入两个参数name和value
1
2
3
4
5
6
|
import
memcache
m
=
memcache.Client([
'10.211.55.4:12000'
], debug
=
True
)
#debug为true时,表示运行出现问题时,显示错误信息。
m.
set
(
"foo"
,
"bar"
)
ret
=
mc.get(
'foo'
)
print
(ret)
|
add:添加一条键值对。如果已经存在该 key,则弹出异常。
1
2
|
m.add(
'k1'
,
'v1'
)
m.add(
'k1'
,
'v2'
)
# 已存在的key重复添加,会报错
|
replace:修改某个key的值,如果key不存在,则异常.
1
|
m.replace(
'kkkk'
,
'999'
)
|
set 和 set_multi
set: 设置一个键值对,如果key不存在,则创建,如果key存在,则修改
set_multi: 设置多个键值对,如果key不存在,则创建,如果key存在,则修改
1
2
|
m.
set
(
'key0'
,
'jack'
)
m.set_multi({
'key1'
:
'val1'
,
'key2'
:
'val2'
})
|
delete 和 delete_multi
delete: 删除指定的一个键值对
delete_multi: 删除指定的多个键值对
1
2
|
m.delete(
'key0'
)
m.delete_multi([
'key1'
,
'key2'
])
|
get 和 get_multi
get: 获取一个键值对
get_multi : 获取多一个键值对
1
2
|
val
=
m.get(
'key0'
)
item_dict
=
m.get_multi([
"key1"
,
"key2"
,
"key3"
])
|
append 和 prepend
append : 修改指定key的值,在原来的值后面追加内容
prepend 修改指定key的值,在原来的值前面插入内容
1
2
3
4
5
|
# k1 = "v1"
m.append(
'k1'
,
'after'
)
# k1 = "v1after"
m.prepend(
'k1'
,
'before'
)
# k1 = "beforev1after"
|
decr 和 incr
incr : 自增,将值增加 N ( N默认为1 )
decr :自减,将值减少 N ( N默认为1 )
1
2
3
4
5
6
7
8
9
|
m.
set
(
'k1'
,
'777'
)
m.incr(
'k1'
)
# k1 = 778
m.incr(
'k1'
,
10
)
# k1 = 788
m.decr(
'k1'
)
# k1 = 787
m.decr(
'k1'
,
10
)
# k1 = 777
|
gets 和 cas
使用缓存系统共享数据资源就必然绕不开数据争夺和脏数据的问题。举个例子:
假设商城某件商品的剩余个数保存在memcache中,product_count = 900
A用户刷新页面从memcache中读取到product_count = 900
B用户刷新页面从memcache中读取到product_count = 900
A、B用户均购买商品,并修改product_count的值:
A用户修改后 product_count=899
B用户修改后 product_count=899
如此一来缓存内的数据便不再正确,实际此时product_count应该等于898.
如果使用python的set和get来操作以上过程,那么程序就会如上述所示情况!
如果想要避免此情况的发生,需要使用 gets 和 cas ,如:
1
2
3
4
5
6
7
8
9
|
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import
memcache
mc
=
memcache.Client([
'10.211.55.4:12000'
], debug
=
True
, cache_cas
=
True
)
v
=
mc.gets(
'product_count'
)
# ...
# 如果有人在gets之后和cas之前修改了product_count,那么,下面的设置将会执行失败,剖出异常,从而避免非正常数据的产生
mc.cas(
'product_count'
,
"899"
)
|
本质上每次执行gets时,会从memcache中获取一个自增的数字,通过cas去修改gets的值时,会携带之前获取的自增值和memcache中的自增值进行比较,如果相等,则可以提交;如果不相等,那表示在gets和cas执行之间,又有其他人执行了gets,则不允许修改。
集群操作
python-memcached模块原生支持集群操作,其原理是在内存维护一个主机列表,且集群中主机的权重值和主机在列表中重复出现的次数成正比。
主机 权重
1.1.1.1 1
1.1.1.2 2
1.1.1.3 1
那么在内存中主机列表为:host_list = ["1.1.1.1", "1.1.1.2", "1.1.1.2", "1.1.1.3", ]
用户如果要在内存中创建一个键值对(如:k1 = "v1"),那么要执行以下步骤:
- 根据算法将 k1 转换成一个数字
- 将数字和主机列表长度求余数,得到一个值 N( 0 <= N < 列表长度 )
- 在主机列表中根据 第2步得到的值为索引获取主机,例如:host_list[N]
- 连接 将第3步中获取的主机,将 k1 = "v1" 放置在该服务器的内存中
代码如下:
1
2
|
m
=
memcache.Client([(
'1.1.1.1:12000'
,
1
), (
'1.1.1.2:12000'
,
2
), (
'1.1.1.3:12000'
,
1
)], debug
=
True
)
m.
set
(
'k1'
,
'v1'
)
|