Xavier's Blog

Intrusive List

| Comments

链表,应该是每一个学编程的人都会接触到的经典数据结构,大部分计算机专业的同学至少在上学期间也实现过单向、双向链表。在我的印象里,链表一般都是这么表示的:

struct LinkNode
{
    LinkNode* prev;
    LinkNode* next;
    int my_data1;
    double my_data2;
    //...
};

class LinkList
{
    LinkNode root;
    //...
};

或者,我们就干脆直接是用std::list<T>。无论是哪一种,它都是将使用的数据“嵌入”到链表的节点中,或者说是节点包在数据之外。这种实现也是教科书里面讲到的那个实现,也是我之前知道的唯一的实现方式。

前段时间看网上的几篇博客(Tips of Linux C programmingAvoiding game crashes related to linked lists),发现原来还有另外一种更优雅的链表实现——intrusive list。Linux kernel,以及许多底层软件(另外还有游戏星际争霸)的开发中,都是使用intrusive list进行链表操作的。

所谓intrusive list,就是指不像上面说的那样将链表节点包在数据外面,而是将链表节点包在数据里面。例如下面这样:

struct list_node_t
{
    list_node_t* prev;
    list_node_t* next;
};

struct MyClass
{
    int data;
    list_node_t node;
};

这样做,是为了让节点和数据在一个数据结构中。因为许多场景下,链表包含的数据是指针(考虑到数据拷贝构造的代价,以及一份数据被多个链表共享的情况),例如std::list<MyClass*>。使用intrusive list实现,就可以省去了”节点 –> 数据指针 –> 数据”的二次查找。找到intrusive list中的一个节点后,就可以立即找到这个节点对应的数据,即我知道一个list_node_t的地址,我改如何找到这个list_node_t对应的MyClassdata呢?这里用到了一段很优美的宏:

#define GET_ENTRY(ptr, type, member)\
    ((type *)((char *)(ptr)-(unsigned long)(&((type *)0)->member)))

第一眼肯定觉得晕,不急,我们一步一步来。首先看参数:

  • ptr: list_node_t的地址

  • type: 包含这个list_node_t的类型,对应上面的例子,就是Myclass

  • member:这个list_node_t类型变量在MyClass中的变量名,需要这个得到改变量的offset

首先看

(&((type *)0)->member)

这个的意思是:如果有个type类型的变量,它的地址是0,那type类型中的member变量的地址是多少,其实就是这个member变量距离所属的type类型变量的偏移量。

然后是

((char *)(ptr)-(unsigned long)(&((type *)0)->member))

这就很清楚了,知道了偏移量,我又知道了真正的member变量的地址(ptr),用ptr的地址减去ptr的偏移量,就得到了ptr所在的type变量的地址了,然后就可以获取type变量上的数据了。

自己简单实现了intrusive list,再和std::list做一个简单的性能测试,对一个int数据的链表插入,结果是:std::list push_back的操作操作时间基本上都在intrusive list的2倍以上!这么看来,intrusive list的优势还是挺明显的。

QuXiaos-MacBook-Pro:intrusive_list quxiao$ ./a.out 1000
std_list: 0.129 ms
intrusive_list: 0.059 ms
QuXiaos-MacBook-Pro:intrusive_list quxiao$ ./a.out 10000
std_list: 1.297 ms
intrusive_list: 0.550 ms
QuXiaos-MacBook-Pro:intrusive_list quxiao$ ./a.out 100000
std_list: 11.961 ms
intrusive_list: 4.901 ms
QuXiaos-MacBook-Pro:intrusive_list quxiao$ ./a.out 1000000
std_list: 116.855 ms
intrusive_list: 53.086 ms
QuXiaos-MacBook-Pro:intrusive_list quxiao$ ./a.out 10000000
std_list: 1061.955 ms
intrusive_list: 544.419 ms

intrusive list的实现以及测试的代码如下:

#include <stdlib.h>
    #include <stdio.h>
    #include <time.h>
    #include <list>
    
    struct list_node_t
    {
        list_node_t* prev;
        list_node_t* next;
    };
    
    struct MyClass
    {
        int data;
        list_node_t node;
    };
    
    void _list_add(list_node_t* cur, list_node_t* prev, list_node_t* next)
    {
        prev->next = cur;
        next->prev = cur;
        cur->prev = prev;
        cur->next = next;
    }
    
    void list_add_head(list_node_t* cur, list_node_t* head)
    {
        _list_add(cur, head, head->next);
    }
    
    void list_add_tail(list_node_t* cur, list_node_t* head)
    {
        _list_add(cur, head->prev, head);
    }
    
    void list_del(list_node_t* cur)
    {
        cur->prev->next = cur->next;
        cur->next->prev = cur->prev;
        cur->prev = cur->next = NULL;
    }
    
    #define GET_ENTRY(ptr, type, member)\
        ((type *)((char *)(ptr)-(unsigned long)(&((type *)0)->member)))
    
    #define INIT_NODE(ptr)\
        (ptr)->next = (ptr)->prev = ptr;
    
    #define list_for_each(pos, head) \
            for (pos = (head)->next; pos != (head); \
                            pos = pos->next)
    
    #define list_for_each_safe(pos, n, head) \
            for (pos = (head)->next, n = pos->next; pos != (head); \
                        pos = n, n = pos->next)
    
    void test_std_list(int run_num)
    {
        int t1 = clock();
        std::list<int> std_list;
        for (int i = 0; i < run_num; i ++)
        {
            std_list.push_back(i);
        }
    
        printf("std_list: %.3lf ms\n", double(clock() - t1) / CLOCKS_PER_SEC * 1000);
    }
    
    void test_intrusive_list(int run_num)
    {
        int t1 = clock();
        list_node_t list_head;
        INIT_NODE(&list_head);
    
        for (int i = 0; i < run_num; i ++)
        {
            MyClass* c = (MyClass*) malloc(sizeof(MyClass));
            c->data = i;
            list_add_tail(&c->node, &list_head);
        }
        printf("intrusive_list: %.3lf ms\n", double(clock() - t1) / CLOCKS_PER_SEC * 1000);
    }
    
    int main(int argc, char** argv)
    {
        if ( argc != 2 )
        {
            fprintf(stderr, "argc is not 2");
            return -1;
        }
        int run_num = atoi(argv[1]);
        if ( 0 == run_num )
        {
            fprintf(stderr, "argv[%s] is not num", argv[1]);
            return -1;
        }
    
        test_std_list(run_num);
        test_intrusive_list(run_num);
    
        return 0;
    }

另外,intrusive list还有几个特点,比如:

  • 移植性好,不像数据包在链表里面的实现,要么每种链表类型都写重复的代码,要么就使用template,但只能在C++中使用

  • 容易使用,你需要使用哪种类型的列表,就在这种类型中添加节点即可

  • 可以方便实现一份数据被多个链表共享的情况,有几个链表,就在类型下添加几个节点变量即可,多个链表直接不会互相干扰

要不是看了那几篇博客,我对链表的认识还停留在教科书上,好歹也看了几本数据结构的书,其中不乏经典书籍,但从没有听说过intrusive list这种实现,看来很多知识,并不是光靠看书就能获取的。

参考材料:

—EOF—

Comments