面试题：Redis 性能瓶颈时如何处理？

当 Redis 出现性能瓶颈时，需要从多个维度进行分析和优化。以下是处理 Redis 性能瓶颈的系统性方法：

内存瓶颈
- 原因：Redis 是内存数据库，内存不足会导致频繁的淘汰策略（如 LFU/LRU）触发，甚至引发 OOM（Out of Memory）异常。
- 表现：INFO memory 中 used_memory 接近 maxmemory，或 evicted_keys 增长。
CPU 瓶颈
- 原因：高并发请求、复杂命令（如 KEYS、SORT）或 Lua 脚本执行时间过长。
- 表现：INFO CPU 中 used_cpu_sys 或 used_cpu_user 接近 100%。
网络瓶颈
- 原因：频繁的小数据包交互（如单次 GET/SET）、客户端与 Redis 之间的 RTT（Round Trip Time）过高。
- 表现：INFO stats 中 instantaneous_ops_per_sec 明显低于理论值。
慢查询
- 原因：未优化的命令（如 KEYS、SMEMBERS）或未使用 Pipeline/Lua 批量处理。
- 表现：SLOWLOG 中记录大量耗时命令。
持久化阻塞
- 原因：AOF 重写或 RDB 快照生成时阻塞主线程。
- 表现：INFO persistence 中 aof_rewrite_in_progress 为 1，或 last_save_time 频繁变化。

限制内存使用
- 设置 maxmemory 和 maxmemory-policy（如 allkeys-lru 或 volatile-ttl），避免内存溢出。
- 示例配置：maxmemory 4gb maxmemory-policy allkeys-lru
优化数据结构
- 使用 Hash 替代多个 String：将对象字段合并到 Hash 中，减少键数量。HSET user:1001 name "Alice" age 30
- 使用 Ziplist/IntSet：通过配置 hash-max-ziplist-entries 和 zset-max-ziplist-entries 压缩小数据结构。
- 避免大 Key：拆分大 Value（如大 List、Hash），降低单次操作的内存消耗。
清除无效数据
- 使用 EXPIRE 设置合理的过期时间，或通过 UNLINK 异步删除大 Key。

减少复杂命令
- 避免使用 KEYS、SMEMBERS 等 O(N) 命令，改用 SCAN 或 SSCAN 分页查询。
- 示例：SCAN 0 MATCH user:* COUNT 100
批量操作
- 使用 Pipeline 合并多个命令，减少网络往返次数。pipe = redis.pipeline() pipe.set('key1', 'value1') pipe.set('key2', 'value2') pipe.execute()
- 使用 Lua 脚本 实现原子操作，减少多次请求。-- 原子性递增并检查库存 local stock = redis.call('GET', 'inv:remain') if stock and stock > 0 then redis.call('DECR', 'inv:remain') return 1 else return 0 end
分片处理
- 将数据分散到多个 Redis 实例（如使用 Redis Cluster 或客户端分片），降低单实例负载。

AOF 重写
- 在从节点执行 BGREWRITEAOF，避免主节点阻塞。
- 配置 no-appendfsync-on-rewrite yes，减少重写期间的 fsync 开销。
RDB 快照
- 调整 save 配置，避免频繁快照。
- 示例：save 900 1 save 300 10 save 60 10000

慢查询日志
- 使用 SLOWLOG GET 分析慢命令，针对性优化。
性能测试工具
- 使用 redis-benchmark 模拟高并发场景，定位瓶颈。redis-benchmark -h 127.0.0.1 -p 6379 -t get,set -n 100000 -q
监控指标
- 关键指标：used_memory、connected_clients、instantaneous_ops_per_sec、rejected_connections。

问题	解决方案
高频访问导致 CPU 高	使用 Pipeline/Lua 脚本批量处理，或升级硬件。
大 Key 导致内存浪费	拆分大 Key，或使用 Hash/Ziplist 优化存储。
网络延迟高	本地部署 Redis，或使用 SSD 提升磁盘性能。
持久化阻塞主节点	在从节点执行 AOF 重写，或关闭主节点持久化（如仅用作缓存）。
缓存击穿/雪崩	使用互斥锁（Mutex）或随机过期时间，或预热缓存。

Redis 性能优化需要结合 监控分析、数据结构选型、批量处理、分片扩展 等多维度策略。核心原则是：

通过上述方法，可显著提升 Redis 的吞吐量和稳定性，满足高并发场景需求。

THE END