内核在分配和释放页帧时需要做很多事情,会耗费较多的时钟周期,为此,我们可以通过一个链表来缓存将要被释放的页,也就是不真正的去释放,而是将其放在一个链表上,下次在分配页时直接从链表上取,这样可以大大减少页帧在释放和分配时的工作量,进而提高性能。在内核中,有这样一个链表——quicklist,它是 per cpu 变量,每个 cpu 对应一个 struct quicklist 类型的结构体变量,通过这个结构体实现了缓存页帧的管理。struct quicklist 的定义如下:
struct quicklist {
void *page;
int nr_pages;
};
刚开始看这个结构体的操作,可能会有点懵,这个链表结构怎么没有 next 指针呢?原来 next 指针被写入到了页帧的最前面,这样做可能是为了节省空间吧。
1)先看页帧的释放操作
static inline void __quicklist_free(int nr, void (*dtor)(void *), void *p,
struct page *page)
{
struct quicklist *q;
q = &get_cpu_var(quicklist)[nr];
*(void **)p = q->page;
q->page = p;
q->nr_pages++;
put_cpu_var(quicklist);
}
第一次调用时,q->page 的值为 NULL,如果多次调用这个函数,将形成下面的这样一个链表:
2)再来看页帧的分配代码,并结合上面的图,可以发现在分配页帧时,是以栈的方式,取最近一次加入链表的节点:
static inline void *quicklist_alloc(int nr, gfp_t flags, void (*ctor)(void *))
{
struct quicklist *q;
void **p = NULL;
q =&get_cpu_var(quicklist)[nr];
p = q->page;
if (likely(p)) {
q->page = p[0];
p[0] = NULL;
q->nr_pages--;
}
put_cpu_var(quicklist);
if (likely(p))
return p;
p = (void *)__get_free_page(flags | __GFP_ZERO);
if (ctor && p)
ctor(p);
return p;
}