文章目录
HashMap的底层是通过数组 + 单向链表/红黑树实现的。
知识点回顾
数组特点
- 存储区间是连续的,且占用内存严重,空间复杂度也很大,时间复杂度为 O(1)。
- 优点: 随机读取效率很高,原因是数组是连续的(随机访问性强,查找速度快)。
- 缺点: 插入和删除数据效率低,因插入数据,这个位置后面的数据在内存中要后移,且大小固定不易动态扩展。
链表特点
- 区间离散,占用内存宽松,空间复杂度小,时间复杂度 O(n)。
- 优点: 插入删除速度快,内存利用率高,没有大小固定,扩展灵活。
- 缺点: 不能随机查找,每次都是从第一个开始遍历(查询效率低)。
以上数组和链表,大家都知道各自优缺点。那么我们能不能把以上两种结合在一起使用,从而实现查询效率高和删除插入效率也高的数据结构呢?答案是可以的,那就是哈希表可以满足,接下来我们一起复习下 HashMap
哈希表特点
实现查询效率高和删除插入效率也高的数据结构
接下来我们一起复习下 HashMap 中的 put() 和 get() 方法实现原理。
HashMap 的 put() 和 get() 的实现
map.put(k, v) 实现原理
-
第1步,首先将 k, v 封装到 Node 对象当中(节点)。
-
第2步,它的底层会调用 K 的 hashCode() 方法得出 hash 值。
-
第3步,通过哈希表函数/哈希算法,将 hash 值转换成数组的下标:
- 下标位置上如果没有任何元素,就把 Node 添加到这个位置上;
- 如果说下标对应的位置上有链表,就会拿着 k 和链表上每个节点的 k 进行 equals:
- 如果所有的 equals 方法返回都是 false,那么这个新的节点将被添加到链表的末尾;
- 如其中有一个 equals 返回了 true,那么这个节点的 value 将会被覆盖。
map.get(k) 实现原理
- 第1步,先调用 k 的 hashCode() 方法得出哈希值,并通过哈希算法转换成数组的下标。
- 第2步,通过上一步哈希算法转换成数组的下标之后,再通过数组下标快速定位到链表所在位置上。
- 如果这个位置上什么都没有,则返回 null;
- 如果这个位置上有单向链表,那么它就会拿着参数 k 和单向链表上的每一个节点的 k 进行 equals:
- 如果所有 equals 方法都返回 false,则 get 方法返回 null;
- 如果其中一个节点的 k 和参数 k 进行 equals 返回 true,那么此时该节点的 value 就是我们要找的 value 了,get 方法最终返回这个要找的 value。
HashMap 的常见面试题
为何随机增删、查询效率都很高?
增删是在链表上完成的,而查询主要是通过数组定位,然后扫描部分链表,所以效率高。
HashMap 集合的 key,会先后调用两个方法:hashCode() 和 equals() 方法,所以当对象充当 key 时,这两个方法都需要重写。
为什么放在 HashMap 集合 key 部分的元素需要重写 equals 方法?
因为 equals 默认比较的是两个对象的内存地址,如果想根据对象的属性来判断,则需要重写。
HashMap 的 key 为什么是无序的?
因为不一定挂到哪一个单向链表上,因此加入顺序和取出也不一样。
HashMap 怎么保持不可重复?
使用 equals 方法来保证 HashMap 的 key 不可重复。如果 key 重复的话,value 就会覆盖。存放在 HashMap 集合中的 key,其实就是存放在 HashSet 集合中,所以 HashSet 集合也需要重写 equals() 和 hashCode() 方法。
HashMap 是如何扩容的?
HashMap 集合的默认初始化容量为16,默认加载因子为 0.75,也就是说当 HashMap 集合底层数组的容量达到 75% 时,数组就开始扩容。HashMap 集合初始化容量是 2 的倍数,是为了达到散列均匀,提高 HashMap 集合的存取效率。
HashMap 在 JDK7 和 JDK8 有什么不同?
-
new HashMap<>(),底层不会再创建一个长度为 16 的数组,改为首次调用 put() 方法时创建;
-
jdk8 底层的数组是 Node[],而非 Entry[];
-
jdk7 底层结构只有:数组+链表,jdk8 中底层结构:数组+链表+红黑树。
-
形成链表时,七上八下
- jdk7:头插法,新元素指向旧元素(多线程修改会有死锁问题);
- jdk8:尾插法,旧元素指向新元素;
-
为什么要用红黑树:
- 首先,正常场景下不会一下子产生特别多的 Hash 冲突,只有非常规的场景下才会出现 Hash 冲突,需要转化为红黑树结构。
- 红黑树解决了超长链表查询效率低下的问题,但是小数据量的链表并不比红黑树的查询效率要低。
- Hash 值如果足够随机,则在 Hash 表内按泊松分布,在负载因子 0.75 的情况下,长度超过 8 的链表出现概率时 0.00000006,选择 8 就是为了尽量降低树化的几率。
-
树化的两个条件:(必须都满足)
- 哈希单向链表中的元素数 > 8
- 当前数组的长度 > 64
-
退化链表的条件:(任何一个满足)
- 红黑树上的节点数 < 6
- remove 节点时,若 root、root.left、root.right、root.left.left 有任意一个为 null,也会退化为链表。
HashMap 的哈希碰撞
如果 key1 和 key2 的哈希值相同,就会存放到同一个单向链表上。
如果 key1 和 key2 的哈希值不同,但由于哈希算法执行结束之后转换的数组下标可能相同,此时会发生哈希碰撞。
HashMap 的 key 允许为 null 吗?
允许
JDK8 中 HashMap 的 put() 方法:
public V put(K key, V value) {
// 采用 hash(key) 来计算 key 的 hashCode 值
return putVal(hash(key), key, value, false, true);
}
static final int hash(Object key) {
int h;
// 当 key 为 null 的时候,不走 hashCode() 方法
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
HashMap 中使用 hash() 方法来计算 key 的哈希值,当 key 为 null 时,直接令 key 的哈希值为0,不走 key.hashCode() 方法,所以即使为 null 也不会抛出空指针异常。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/132212.html