《高性能网站建设指南》中有一条建议,为网站的页面、文件“添加 Expires 头”。这么做的好处就不多说了,实现方式也比较简单,不过,真的实施这条建议时,还是有许多问题需要考虑。
通常情况下,我们需要将图片、js、css 等不会经常更新的文件缓存起来,一般来说,配置服务器,为它们设置一个较远的未来的 Expires 时间就可以了(比如 1 年后)。不过,在一个经常会更改的网站中,某些 js/css 文件可能并不是一成不变的,虽然它们的更新频率比较低,但还是会不时地更新,我们希望在它们被更新后客户端也能及时更新,而不是依旧使用老的缓存。
解决这个问题的办法有很多,常用的一种是在这些 js/css 后面加上一个版本号或最后修改时间,比如:
|
<link
href
=
"/css/c.css?v=0.1.2"
rel
=
"stylesheet"
type
=
"text/css"
media
=
"screen"
/>
<script
type
=
"text/javascript"
src
=
"/js/c.js?v=3.0.1"
>
</script>
|
如上所示,文件地址后面跟了一个 v 参数,如果文件版本更新了,我们也只需要更改这个参数的值,用户的浏览器就会重新下载新的版本。
不过同时我们又遇到了新的问题:js/css 文件与上面的 HTML 通常是在两个文件中,有时一个 js/css 在很多 HTML 或模板中都有引用,如果一个 js/css 更新了,我们不得不手动更改这些 HTML 模板文件,这是一个很枯燥的工作,而且一不小心就会有遗漏。
好在我们使用的是 Django,我们可以有一些“Djangoly”的解决方法。前不久,我就看到一个很有创意的写法,类似于这样:
|
<link
href
=
"{{ "
/css
/c
.css
"|file_time_stamp }}"
rel
=
"stylesheet"
type
=
"text/css"
media
=
"screen"
/>
<script
type
=
"text/javascript"
src
=
"{{ "
/
js
/c.js"|file_time_stamp }}"></s
cript
>
|
熟悉 Django 的朋友应该能立即明白,这儿自定义了一个 filterfile_time_stamp ,将 js/css 文件地址作为参数,读取相应文件的最后修改时间,附加到文件地址后面。最终生成的 HTML 形如:
|
<link
href
=
"/css/c.css?fmts=1289306718.0"
rel
=
"stylesheet"
type
=
"text/css"
media
=
"screen"
/>
<script
type
=
"text/javascript"
src
=
"/js/c.js?fmts=1287902444.0"
>
</script>
|
这样,当 js/css 文件发生变化时,最后修改时间也会发生变化,相应的参数也会变化
这个 filter 的实现很简单。不过我又想到另一个问题:如果页面访问量比较大,这个 filter 是否会导致硬盘的频繁读操作?如果使用缓存将文件的最后修改时间记住一小段时间会不会更好?于是有了下面的我的实现代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
# 请将这一段加到你的自定义标签、过滤器文件中
import
os
from
django
.
core
.
cache
import
cache
# 注意,完整代码还需要 import 更多相关模块
# ...
@
register
.
filter
(
name
=
"file_time_stamp"
)
def
file_time_stamp
(
value
)
:
u
"""
在 js/css 后面添加最后修改时间的时间戳,如:
/js/c.js -> /js/c.js?fmts=1289377595.3
如果没找取对应的文件,则直接返回原value
"""
cache_key
=
"_file_time_stamp__%s"
%
value
v
=
cache
.
get
(
cache_key
)
if
v
:
# 如果指定缓存不存在,v 的值将为 None
return
v
if
value
.
startswith
(
"/"
)
:
fn
=
os.path
.
join
(
ROOT_DIR
,
"media"
,
value
[
1
:
]
.
replace
(
"/"
,
os
.
sep
)
)
if
os.path
.
isfile
(
fn
)
:
ts
=
os
.
stat
(
fn
)
.
st_mtime
sp
=
"?"
if
"?"
not
in
value
else
"&"
value
=
"%s%sfmts=%.1f"
%
(
value
,
sp
,
ts
)
cache
.
set
(
cache_key
,
value
,
300
)
# 300 秒后缓存到期
return
value
|
你可以在 settings.py 中指定使用哪种缓存,我使用的是内存缓存(CACHE_BACKEND = “locmem:///”)。
我也对使用缓存和直接用 os 模块读取文件最后修改时间两种方式的效率进行了简单的测试。不过,使用缓存并没有带来我原来预期的性能上的提高,相反,似乎比直接用 os 模块读取文件最后修改时间的性能还有略低一点。我将读取缓存与读取文件最后修改时间的操作各执行了 10 万次,在我的本本上(Ubuntu 10.04 系统),前者花费的时间约为 2.9 秒,后者约为 2.5 秒,不知道在使用 os 模块读取文件最后修改时间时,这个值是不是会在系统级别上缓存起来。
reference:http://oldj.net/article/django-site-static-file-cache/