面试题：为什么 JDK 1.8 对 HashMap 进行了红黑树的改动？ - 程序百科-程序百科

面试题：为什么 JDK 1.8 对 HashMap 进行了红黑树的改动？

11个月前更新

475

JDK 1.8 对 HashMap 引入红黑树的主要目的是优化极端情况下哈希冲突导致的性能问题，通过将链表转换为红黑树，将最坏情况下的时间复杂度从 O(n) 降低到 O(log n)，从而显著提升性能。以下是详细分析：

1. 背景与问题

在 JDK 1.7 及之前的版本中，HashMap 使用 数组 + 链表 的结构解决哈希冲突。当大量键值对的哈希值映射到同一个桶（bucket）时，链表会变得非常长，导致以下问题：

查询效率下降：链表查找的时间复杂度从 O(1) 退化为 O(n)。
极端场景性能恶化：例如恶意构造大量哈希冲突（哈希碰撞攻击），所有元素集中在同一个链表中，性能急剧下降。

2. 红黑树的引入

（1）核心思想

JDK 1.8 引入 红黑树（Red-Black Tree）作为链表的替代结构：

当链表长度超过 8 且数组长度 ≥ 64 时，链表转换为红黑树。
当红黑树节点数减少到 6 时，红黑树会重新转换为链表。

（2）红黑树的优势

自平衡特性：红黑树通过旋转和颜色标记保持树的平衡，确保树的高度始终为 O(log n)。
高效操作：插入、删除、查找的时间复杂度均为 O(log n)，远优于链表的 O(n)。
抵御哈希攻击：即使所有键的哈希值相同，红黑树仍能通过键的自然排序或自定义比较器（Comparable）维持 O(log n) 的查询效率。

3. 转换条件的设定

（1）链表转红黑树的条件

链表长度 ≥ 8：这是基于泊松分布的统计概率（默认负载因子 0.75 时，链表长度为 8 的概率极低）。
数组长度 ≥ 64：避免在数组容量较小时过早树化，减少内存浪费和频繁转换的开销。

（2）红黑树转链表的条件

节点数 ≤ 6：防止链表与红黑树频繁转换（阈值差 2 用于避免震荡）。

4. 性能优化效果

（1）极端场景下的性能提升

哈希冲突严重时：例如所有键的哈希值相同，链表长度为 1000 时，查询时间从 1000 次遍历 降低到 log₂(1000) ≈ 10 次查找。
实际测试数据：
链表：查找时间复杂度为 O(n)，最坏情况需遍历全部节点。
红黑树：查找时间复杂度为 O(log n)，最坏情况只需 log₂(n) 次比较。

（2）内存与性能的平衡

避免小数组的树化：当数组容量较小时，扩容后哈希冲突会减少，此时直接扩容比树化更高效。
红黑树的内存开销：红黑树节点需要额外存储颜色标记和子节点指针，因此仅在链表足够长时才转换。

5. 其他相关优化

（1）扰动函数优化

JDK 1.7：通过 4 次移位和 5 次异或计算哈希值。
JDK 1.8：简化为 1 次右移异或（h ^ (h >>> 16)），降低哈希冲突概率，提升效率。

（2）扩容机制改进

JDK 1.7：扩容时需重新计算所有元素的哈希值。
JDK 1.8：通过 (e.hash & oldCap) 判断新索引，仅需判断高位，避免重复计算。

（3）尾插法替代头插法

JDK 1.7：头插法可能导致扩容时链表成环（多线程下死循环）。
JDK 1.8：尾插法避免了环形链表问题，提升并发安全性。

6. 实际应用场景

（1）高并发场景

线程安全问题：HashMap 本身不线程安全，但红黑树的引入减少了单个桶的冲突，间接降低了并发修改时的锁竞争。

（2）哈希攻击防御

恶意构造哈希冲突：通过红黑树限制单个桶的节点数量，避免性能退化。

7. 总结

JDK 1.8 对 HashMap 的红黑树优化主要体现在以下几个方面：

优化点	JDK 1.7	JDK 1.8
数据结构	数组 + 链表	数组 + 链表 + 红黑树
链表转红黑树条件	无	链表长度 ≥ 8 且数组长度 ≥ 64
查询效率	O(n)（链表过长时）	O(log n)（红黑树）
扰动函数	4 次移位 + 5 次异或	1 次移位 + 1 次异或
扩容机制	重新计算哈希值	通过高位判断新索引
插入方式	头插法（可能导致环形链表）	尾插法（避免环形链表）

通过引入红黑树，HashMap 在极端哈希冲突场景下实现了性能的稳定性和高效性，同时通过动态转换机制平衡了内存与性能的开销。这一改动是 Java 集合框架在高并发和大数据量场景下的重要优化。

THE END

喜欢就支持一下吧

相关推荐