Java HashMap 详解

2024-02-29 14:55 由低吟不作语发表于 #后端开发

HashMap

HashMap 继承自 AbstractMap，实现了 Map 接口，基于哈希表实现，元素以键值对的方式存储，允许键和值为 null。因为 key 不允许重复，因此只能有一个键为 null。HashMap 不能保证放入元素的顺序，它是无序的，和放入的顺序并不相同。HashMap 是线程不安全的。

1. 哈希表

哈希表基于数组实现，当前元素的关键字通过某个哈希函数得到一个哈希值，这个哈希值映射到数组中的某个位置。哈希函数的好坏直接决定该哈希表的性能

当我们对某个元素进行哈希运算，得到一个存储地址，然后要进行插入的时候，发现已经被其他元素占用了，这就是所谓的哈希冲突，也叫哈希碰撞

解决方法如下：

开放定址法：当冲突发生时，使用某种探查技术在散列表中形成一个探查序列，沿此序列逐个单元地查找，直到碰到一个开放的地址（即该地址单元为空），将待插入的新结点存入该地址单元
链地址法：可将散列表定义为一个由 m 个头指针组成的指针数组，将所有关键字为同义词的结点链接在同一个单链表中，初始时数组中各分量的初值应均为 1
再哈希法：同时构造多个不同的哈希函数，发生冲突时再换别的哈希函数

2. JDK1.7 实现原理

HashMap 由数组和链表实现对数据的存储，HashMap 里面实现一个静态内部类 Entry，包含 Key、Value 和对 key 的 hashcode 值进行 hash 运算后得到的 Hash 值，它还具有 Next 指针，可以连接下一个 Entry 实体，以此来解决 Hash 冲突的问题

3. JDK1.7 存储流程

初始化哈希表：真正初始化哈希表（初始化存储数组）是在第一次添加键值对时
- 数组为空：设置默认阈值与初始容量
- 设置了传入容量：将传入的容量大小转化为大于自身的最小的二次幂。如果超出最大允许容量，则设置为最大值
判断键是否为空：对 null 作哈希运算，结果为 0，所以以 null 为键的键值对一般放在数组首位，该位置的新值总是会覆盖旧值
计算元素存放位置：首先根据 key 的 hashcode 计算 hash 值，然后根据 hash 值计算 index 下标值
- 哈希冲突：当发生哈希冲突时，为了保证键的唯一性，哈希表不会马上在链表中插入新数据，而是先遍历链表，查找该键是否已存在，若已存在，替换即可
添加键值对：使用头插法，新添加元素放在链表头部，原始节点作为新节点的后继节点

4. JDK1.7 哈希函数

JDK 1.7 做了 9 次扰动处理 = 4 次位运算 + 5 次异或运算

5. JDK1.7 下标计算

计算元素位置采用的是 & 运算，该方法返回 h & (length - 1)，其中 h 为 key 的 hash 值，length 是数组长度

6. JDK1.7 扩容机制

先判断是否需要扩容，再插入

7. JDK1.8 实现原理

1.8 以前 HashMap 采用数组 + 链表实现，即使用链表处理冲突，同一 hash 值的节点都存储在一个链表里。但是当同一 hash 值相等的元素较多时，通过 key 值依次查找的效率较低。JDK1.8 中，HashMap 采用数组 + 链表 + 红黑树实现，当链表长度超过阈值时，将链表转换为红黑树，大大减少了查找时间

8. JDK1.8 存储流程

初始化哈希表：真正初始化哈希表（初始化存储数组）是在第一次添加键值对时
- 数组为空：设置默认阈值与初始容量
- 设置了传入容量：将传入的容量大小转化为大于自身的最小的二次幂。如果超出最大允许容量，则设置为最大值
判断键是否为空：对 null 作哈希运算，结果为 0，所以以 null 为键的键值对一般放在数组首位，该位置的新值总是会覆盖旧值
计算元素存放位置：首先根据 key 的 hashcode 计算 hash 值，然后根据 hash 值计算 index 下标值
- 哈希冲突：当发生哈希冲突时，为了保证键的唯一性，哈希表不会马上在链表中插入新数据，而是先遍历链表，查找该键是否已存在，若已存在，替换即可；如果不存在，判断当前节点类型是不是树型节点，如果是树型节点，创造树型节点插入红黑树中；如果不是树型节点，创建普通 Node 加入链表中；判断链表长度是否大于 8 并且数组长度大于 64，大于的话链表转换为红黑树
添加键值对：链表的插入方式从头插法改成了尾插法，简单说就是插入时，如果数组位置上已经有元素，1.7 将新元素放到数组中，原始节点作为新节点的后继节点，1.8 遍历链表，将元素放置到链表的最后

9. JDK1.8 哈希函数

JDK 1.8 简化了扰动函数 = 只做了 2 次扰动 = 1 次位运算 + 1 次异或运算，本质是哈希码的低 16 位异或高 16 位

10. JDK1.8 下标计算

计算元素位置采用的是 & 运算，该方法返回 h & (length - 1)，其中 h 为 key 的 hash 值，length 是数组长度

11. JDK1.8 扩容机制

先进行插入，插入完成再判断是否需要扩容。扩容时，1.7 需要对原数组中的元素进行重新 hash 定位，以确定在新数组中的位置，1.8 采用更简单的判断逻辑，位置不变或索引 + 旧容量大小

Java HashMap 详解

HashMap

1. 哈希表

2. JDK1.7 实现原理

3. JDK1.7 存储流程

4. JDK1.7 哈希函数

5. JDK1.7 下标计算

6. JDK1.7 扩容机制

7. JDK1.8 实现原理

8. JDK1.8 存储流程

9. JDK1.8 哈希函数

10. JDK1.8 下标计算

11. JDK1.8 扩容机制

相关问题

1. 扩容机制？

2. 针对扩容机制的优化方案？

3. 为什么不直接使用 hashcode 作为存储数组的下标位置？

4. 为什么要作扰动处理？

5. 为什么采用（哈希码 & 数组长度减一）这种方式？

6. 为什么在 1.8 使用尾插法插入新结点？