面试题：为什么 Netty 不使用 ThreadLocal 而是自定义了一个 FastThreadLocal ？

Netty 使用 FastThreadLocal 而不是标准的 Java ThreadLocal，主要是为了提高性能和优化内存使用。

虽然 ThreadLocal 提供了线程本地存储的能力，允许每个线程拥有其变量的一个独立初始化的副本，但在高并发场景下，特别是在Netty这种需要处理大量并发连接的应用中，ThreadLocal 的一些性能瓶颈变得明显。

以下是几个主要原因解释为何 Netty 选择实现自己的 FastThreadLocal：

索引查找效率：在 ThreadLocal 中，每个线程都有一个与之关联的 ThreadLocalMap，这个映射表用于存储该线程的所有 ThreadLocal 变量。
当访问某个 ThreadLocal 变量时，实际上是通过一个哈希查找来定位相应的值。
相比之下，FastThreadLocal 使用了一个整数索引来直接访问数据，避免了哈希冲突和链表遍历带来的开销，从而提高了查找速度。
减少垃圾回收压力：由于 ThreadLocal 的实现方式，它可能会导致对象难以被垃圾回收器及时回收（尤其是当 ThreadLocal 存储的对象生命周期较长或引用了较大的对象图时），这会增加内存占用并可能引发内存泄漏问题。而 FastThreadLocal 设计上更加注重内存管理，有助于降低此类风险。

扁平化存储结构：不同于 ThreadLocal 使用的映射表结构，FastThreadLocal 采用了更直接、扁平化的数组形式来存储数据。这样的设计不仅加快了数据访问速度，还能更好地利用CPU缓存，进一步提升了性能表现。

Netty特定优化：FastThreadLocal 是针对Netty框架的需求特别设计的，比如它可以更好地适应Netty的事件驱动模型以及高效处理大量并发连接的要求。此外，它还提供了额外的功能，如支持弱引用清理机制，帮助解决潜在的内存泄漏问题。

综上所述，Netty之所以选择自定义 FastThreadLocal 而不直接使用Java标准库中的 ThreadLocal，主要是出于对性能的高度追求以及对内存使用的精细控制。

通过这种方式，Netty能够在保持高效运行的同时，确保系统资源得到有效利用，并减少因不当使用 ThreadLocal 可能引起的内存泄漏等常见问题。

这对于构建高性能、稳定的网络应用至关重要。

THE END