面试题：Redisson 看门狗（watch dog）机制了解吗？

Redisson 的 看门狗（Watch Dog）机制 是其分布式锁实现中的核心特性，用于解决分布式锁因业务执行时间过期而导致锁提前释放的问题。以下是对其原理、作用和实现的详细解析：

在分布式系统中，使用 Redis 实现分布式锁时，通常需要为锁设置一个 过期时间（TTL），以防止客户端因异常（如宕机、网络故障）导致锁无法释放，进而阻塞其他客户端。然而，这会引入一个问题：

看门狗机制通过 自动续期 解决这一矛盾，确保锁在业务执行期间始终有效，同时避免锁长时间占用资源。

锁的初始设置
- 当客户端通过 lock() 或 tryLock() 获取锁时，若未指定锁的过期时间（leaseTime），Redisson 会默认设置锁的初始过期时间为 30 秒。
- 同时，Redisson 会启动一个 后台定时任务（看门狗线程），定期检查锁的状态并自动续期。
自动续期逻辑
- 续期频率：默认每隔 10 秒（即锁初始过期时间的 1/3）续期一次。
- 续期操作：通过 Redis 的 EXPIRE 命令，将锁的过期时间重置为初始值（如 30 秒）。
- 续期条件：只有当前持有锁的客户端仍在运行且未主动释放锁时，续期操作才会触发。
锁的释放
- 当客户端主动调用 unlock() 方法释放锁时，Redisson 会通过 Lua 脚本验证锁的持有者身份（通过唯一标识，如 UUID + 线程 ID），确保只有锁的持有者能释放锁。
- 如果客户端异常退出（如宕机），看门狗线程无法运行，锁会在 初始过期时间（30 秒）后自动释放。

获取锁
- 客户端调用 lock() 或 tryLock() 方法获取锁。
- 若未指定 leaseTime，Redisson 会设置锁的初始过期时间为 30 秒，并启动看门狗线程。
后台续期
- 看门狗线程每隔 10 秒检查锁是否仍被当前客户端持有。
- 如果锁存在且持有者是当前客户端，则通过 Lua 脚本将锁的过期时间重置为 30 秒。
锁释放
- 客户端主动调用 unlock() 方法释放锁。
- 看门狗线程停止续期，锁的生命周期结束。

Lua 脚本保证原子性
- 续期操作通过 Lua 脚本执行，确保检查锁是否存在和更新过期时间的原子性，避免并发问题。
- 示例 Lua 脚本：if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then redis.call('pexpire', KEYS[1], ARGV[1]) return 1 end return 0
定时任务管理
- Redisson 使用 EXPIRATION_RENEWAL_MAP 管理所有续期任务，确保每个锁的续期任务独立运行。
- 定时任务由 TimerTask 实现，默认使用 Netty 的 HashedWheelTimer。
参数配置
- 默认配置：
  - 初始过期时间：30s（internalLockLeaseTime）
  - 续期间隔：10s（internalLockLeaseTime / 3）
- 自定义配置：
  - 可通过 config.setLockWatchdogTimeout(...) 修改默认续期时间。
  - 若手动指定 leaseTime（如 lock.lock(10, TimeUnit.SECONDS)），看门狗机制 不会生效。

默认启用
- 直接调用 lock() 方法，不指定 leaseTime：RLock lock = redisson.getLock("myLock"); lock.lock(); // 默认启用看门狗机制
显式启用
- 调用 tryLock() 方法时，将 leaseTime 设置为 -1：RLock lock = redisson.getLock("myLock"); lock.tryLock(-1, 30, TimeUnit.SECONDS); // leaseTime=-1 启用看门狗
禁用看门狗
- 手动指定 leaseTime，看门狗机制不会生效：RLock lock = redisson.getLock("myLock"); lock.lock(10, TimeUnit.SECONDS); // leaseTime=10s，看门狗不生效

Redisson 的看门狗机制通过 自动续期 解决了分布式锁的过期时间设置难题，既避免了锁提前释放导致的并发问题，又防止了锁长时间占用资源。其核心在于：

在实际使用中，需根据业务场景合理配置参数，并确保正确释放锁，以充分发挥看门狗机制的优势。

THE END