Last updated
Last updated
跳表是可以实现二分查找的有序链表,实现原理是将多个链表在纵向串起来,在原有的有序链表上面增加了多级索引,通过索引来实现快速查找。
主要用于有序集合 Zset
结构里,按 score
排序 member
最低层包含所有的元素
每个索引节点包含两个指针,一个向下,一个向右
插入元素时,先插入最底层,然后以 1/4
的概率插入上层(最大层高 = 32
)。这样随机生成它的最高层高
跳表查询、插入、删除的时间复杂度为 O(log n)
,与平衡二叉树接近
范围查找更快。二叉树需要不断的中序遍历,性能较差。
跳表更紧凑,省空间。每个节点平均 1 + 0.25 + 0.25² + ... + 0.25^31 = 1.33
个指针。二叉树是 2
个指针。
跳表实现更简单。二叉树增删元素时可能需要调整多层节点;跳表只需调整前后的邻节点。
跳表写数据时只需生成随机层数,没有旋转和维持树平衡的开销,因此写入性能优于B+树
同样量级的数据,B+树层高比跳表矮,因此查询比B+树快
facebook 的 rocksDB 用了B+树,就是写性能贼强,读性能差点
Redis 的数据都存在内存,不需要像 MySQL 一样按页从磁盘加载数据到内存,因此层高不再是跳表的劣势
跳表节点 zskiplistNode
插入
插入前由 hashmap
来防重
问题
这个值是对空间和时间的权衡。p 值太大的话,上层索引节点数量太多,上层几乎退化成顺序遍历,相当于没有索引;p 值太小,上层索引过于稀疏,起不到作用,最后也只能到最下层顺序遍历。
见上面
手绘一个跳表看看?
比如要查找分值 [6 ~ 8] 的元素,第一层查到 [5, tail),第二层查到 [5, 9],第三层就在 [5,6,7,8,9] 里遍历查找
参考