数据淘汰机制

过期机制

redis 的根对象是一个 redisDb 结构体。

里面有个 expire 字段,存储了所有设置了过期时间的 key。其中,key 是指向 redisObject 的指针,value 是该键的过期时间

typedef struct redisDb {
    dict *dict;                 // 保存所有 kv
    dict *expires;              // 设置了过期时间的 key 及其过期时间
}

因此当我们使用 EXPIRE key duration 命令对一个 key 设置过期时间时,会将该 key 保存到 expires 这个字典中,就是说一个 key 存了两次,额外占用内存。但这个 keyvalue 不是实际数据的 value,而是过期时间。

过期删除

  • 定时过期:给每个设置过期时间的 key 都创建一个定时器,到过期时间就会立即清除。该策略可以立即清除过期的数据,对内存很友好;但是会占用大量的 CPU 资源去处理过期的数据,从而影响缓存的响应时间和吞吐量。

  • 惰性过期:只有当访问一个 key 时,才会判断该 key 是否已过期,过期则清除。该策略可以最大化地节省 CPU 资源,却对内存非常不友好。

  • 定期过期:每隔一定的时间,会扫描一定数量的数据库的 expires 字典中一定数量的 key,并清除其中已过期的 key。该策略是前两者的一个折中方案。通过调整定时扫描的时间间隔和每次扫描的限定耗时,可以在不同情况下使得 CPU 和内存资源达到最优的平衡效果。

    • expires 字典会保存所有设置了过期时间的 key 的过期时间数据,扫描时是随机抽样

  • 驱逐时检查:redis 空间满时,会触发数据淘汰,也会检查过期的 key 并将其删除。

redis 使用的是 惰性过期 + 定期过期 + 驱逐时检查 的三种策略。

数据淘汰机制

简介

redis 可以通过 maxmemory <bytes> 配置项来设置允许用户使用的最大内存大小,当内存数据集大小达到一定的大小时,就会根据 maxmemory-policy noeviction 配置项配置的策略来进行数据淘汰/驱逐。

redis 5.0 提供了 8 种数据淘汰策略:

  • volatile-lfu

    从已设置过期时间的数据集(server.db[i].expires)中挑选使用频率最低的数据淘汰

  • volatile-lru

    从已设置过期时间的数据集中挑选最近最少使用的数据淘汰

  • volatile-random

    从已设置过期时间的数据集中任意选择数据淘汰

  • volatile-ttl

    从已设置过期时间的数据集中挑选将要过期的数据淘汰

  • allkeys-lfu

    从所有数据(server.db[i].dict)中挑选最近最少使用的数据淘汰

  • allkeys-lru

    从所有数据中挑选使用频率最低的数据淘汰

  • allkeys-random

    从所有数据中任意选择数据淘汰

  • noeviction

    禁止驱逐数据,永远不过期。此时会拒绝写操作,对写操作返回一个错误,默认为该项

淘汰机制

redisobject 中都会为每个 redis 对象设置最近访问时间,每次访问的时候都会更新 redisObject.lru

redisDb 中,dict 字段保存了所有对象,expires 字段保存了所有设置了 TTL 的对象。淘汰数据时,根据策略从这两个哈希表里挑选对象删除

LRU数据淘汰机制

该淘汰机制是这样的:在数据集中随机挑选几个键值对,取出其中 lru 最大的键值对进行淘汰。

redis 并不是保证取得所有数据集中最近最少使用(LRU)的键值对,而只是随机挑选的几个键值对中的。

以下是定时任务,每秒调用 server.hz 次,主要异步做一些相应的操作,例如:

  • 淘汰过期 key

  • 软件监控

  • 更新一些统计信息

  • 如果有哈希表在搬迁,协助搬迁

  • 触发 BGSAVE/AOF 写等持久化操作

  • 不同种类的客户端超时

  • 复制同步重连接

TTL数据淘汰机制

LRU 数据淘汰机制类似,TTL 数据淘汰机制是这样的:从过期时间 redisDB.expires 表中随机挑选几个键值对,取出其中 TTL 最近的键值对淘汰。

同样你会发现,redis 并不是保证取得所有过期时间的表中最快过期的键值对,而只是从中随机挑选几个选 TTL 最近的。

数据淘汰过程

redis 每次执行写命令的时候,都会检测使用的内存是否超额,如果超额则进行数据淘汰,即在执行读写的时间才会进行数据淘汰。

processCommand() 函数在执行命令的时候会检测内存使用情况,这时会调用 freeMemoryIfNeeded() 函数来进行淘汰,该函数主要是释放足够的内存来保持 redis 在其配置内存限制之内,他计算需要释放多少内存,然后进入循环选择最合适的键进行删除,不断删除,直到空间占用小于 maxmemory 为止。

源码

这段建议跳过

问题

注意,使用 SET key val 命令修改数据会清除原数据的过期时间

参考

bingbo - Redis数据淘汰机制

Last updated