面试题：什么是服务限流？ - 程序百科-程序百科

服务限流（Rate Limiting）是一种用于控制服务请求流量的技术，目的是在系统资源有限的情况下，防止过多的请求导致系统过载或崩溃。通过限制单位时间内的请求数量，服务限流可以保护系统的稳定性、可用性和性能。

服务限流的核心目标

保护系统资源：
- 防止过多的请求耗尽系统的 CPU、内存、数据库连接等资源。
- 避免系统因过载而崩溃或响应变慢。
保证服务质量：
- 确保系统在高并发场景下仍能正常处理请求。
- 避免因流量激增导致的服务不可用或响应超时。
防止恶意攻击：
- 限制恶意用户或机器人的高频请求，防止 DDoS 攻击或爬虫滥用。
公平分配资源：
- 在多用户或多租户系统中，确保每个用户或租户公平地使用系统资源。

服务限流的常见策略

QPS 限流：
- 限制每秒的请求量（Queries Per Second, QPS）。
- 例如，限制某个 API 的 QPS 不超过 100。
并发数限流：
- 限制同时处理的请求数量。
- 例如，限制某个服务的并发线程数不超过 50。
令牌桶限流：
- 使用令牌桶算法控制请求速率。
- 系统以固定速率生成令牌，每个请求需要消耗一个令牌。
- 如果令牌不足，则拒绝请求。
漏桶限流：
- 使用漏桶算法控制请求速率。
- 请求以固定速率被处理，超出速率的请求会被拒绝或排队。
基于用户或 IP 的限流：
- 针对特定用户或 IP 地址进行限流。
- 例如，限制每个用户每分钟只能发起 10 次请求。
动态限流：
- 根据系统的实时负载动态调整限流阈值。
- 例如，当系统 CPU 使用率超过 80% 时，自动降低 QPS 限制。

服务限流的实现方式

单机限流：
- 在单个服务实例中实现限流，适用于单机部署的场景。
- 常用算法：计数器、滑动窗口、令牌桶、漏桶。
分布式限流：
- 在分布式系统中实现全局限流，适用于多实例部署的场景。
- 常用技术：Redis 分布式计数器、Sentinel 集群限流。
网关限流：
- 在 API 网关中实现限流，适用于微服务架构。
- 常用组件：Spring Cloud Gateway、Nginx、Kong。

服务限流的应用场景

高并发系统：
- 电商秒杀、抢购等场景，防止流量激增导致系统崩溃。
API 接口保护：
- 限制第三方调用 API 的频率，防止滥用。
多租户系统：
- 限制每个租户的资源使用，确保公平性。
防止恶意攻击：
- 限制恶意用户或机器人的高频请求，防止 DDoS 攻击。
系统负载保护：
- 当系统负载过高时，自动限流，避免系统崩溃。

服务限流的优缺点

优点

保护系统稳定性：防止系统因过载而崩溃。
提高服务质量：确保系统在高并发场景下仍能正常处理请求。
防止资源滥用：限制恶意用户或机器人的高频请求。

缺点

可能影响用户体验：如果限流策略过于严格，可能导致合法用户无法访问服务。
实现复杂度高：分布式限流和动态限流的实现较为复杂。

常见的限流工具和框架

Sentinel：
- 阿里巴巴开源的流量控制组件，支持 QPS 限流、线程数限流、熔断降级等功能。
Hystrix：
- Netflix 开源的容错组件，支持限流、熔断、降级等功能。
Nginx：
- 高性能的 HTTP 服务器和反向代理服务器，支持基于 IP 或用户的限流。
Redis：
- 使用 Redis 的计数器功能实现分布式限流。
Spring Cloud Gateway：
- Spring Cloud 生态中的 API 网关，支持限流、熔断等功能。

总结

服务限流是一种重要的流量控制技术，用于保护系统的稳定性、可用性和性能。通过合理的限流策略（如 QPS 限流、令牌桶限流），可以有效防止系统过载和资源滥用。在实际项目中，可以根据业务需求选择合适的限流工具和框架（如 Sentinel、Nginx），并结合单机限流和分布式限流的实现方式，构建高可用的系统。

THE END

SpringCloud 面试题