上篇复习了数据结构 java中的集合其实就是各种数据结构的体现. 在不同的场景下使用不同的集合来支撑业务显得尤为关键.
我们常用的集合无非就是List Map Queue 像Set Stack Vector 这些用的相对就不是那么频繁. 所以很多特性及使用场景都被忘记了. 今天打算花一整天的时间来Review一下 所了解过的关于集合的知识.
先来一张图
上图几乎涵盖了JAVA中所有的集合 可以抽时间进行梳理一下.
接下来我们就按照图上的顺序来进行Review.
首先是EnumMap 这个类我没怎么用过.但是看名字能看出来是个枚举类 扒开源码看一下
public class EnumMap<K extends Enum<K>, V> extends AbstractMap<K, V>
EnumMap继承自抽象Map,而AbstactMap 实现了Map接口 就不多说了 . 使用场景 比如我们可以建一个 以星期为内容的EnumMap 然后key存放1-7 value存放 ' 星期一~七' 就可以实现枚举
下面来到的是本篇重点HashMap. HashMap是面试中最长提到的点 也是最为关键的点. 所以必须要详细了解
HashMap 是一个散列表,它存储的内容是键值对(key-value)映射。
HashMap 继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。
//hashMap的四个构造函数
// 默认构造函数。
HashMap()
// 指定“容量大小”的构造函数
HashMap(int capacity)
// 指定“容量大小”和“加载因子”的构造函数
HashMap(int capacity, float loadFactor)
// 包含“子Map”的构造函数
HashMap(Map<? extends K, ? extends V> map)
HashMap 的实现不是同步的,这意味着它不是线程安全的。它的key、value都可以为null。此外,HashMap中的映射不是有序的。
HashMap 的实例有两个参数影响其性能:“初始容量” 和 “加载因子”。容量 是哈希表中桶的数量,初始容量 只是哈希表在创建时的容量。加载因子 是哈希表在其容量自动增加之前可以达到多满的一种尺度。当哈希表中的条目数超出了加载因子与当前容量的乘积时,则要对该哈希表进行 rehash 操作(即重建内部数据结构),从而哈希表将具有大约两倍的桶数。
通常,默认加载因子是 0.75(可以通过float型的构造方法来设置), 这是在时间和空间成本上寻求一种折衷。加载因子过高虽然减少了空间开销,但同时也增加了查询成本(在大多数 HashMap 类的操作中,包括 get 和 put 操作,都反映了这一点)。在设置初始容量时应该考虑到映射中所需的条目数及其加载因子,以便最大限度地减少 rehash 操作次数。如果初始容量大于最大条目数除以加载因子,则不会发生 rehash 操作
我们在遍历map的时候常用到 map.entry 一开始我特别不理解这个entry到底是个什么东西 现在对他的理解大致在 是存放键值对关系的一个对象 然后遍历的时候其实获取的是这个对象 然后进行遍历 而Entry 也是实现hashMap的关键.
拉链法(hashMap的关键点)
拉链表是jdk8以前解决hash冲突的唯一方式 什么叫hash冲突?
我的理解是 两个不一样的key值 在经过hash算法计算后 得到了同样的hashcode 由此得到了同样的存放位置. 在hashmap中 会优先比较hashcode 然后再对key值通过equals方法比较,如果相同则对当前key进行覆盖.如果不同,则拉个链表来存放两个hashcode相同的key-value值. 但这个方法在JDK8中做了一定的改动,当拉链表到达一定的程度时 或者说到了一定的阀值(默认是大于等于7)时,hashmap会将其转化为红黑树的形式,在源码中用treeNode来实现, Entry一词也换成了Node. 因为当链表的长度过长会很大程度上影响查询速度,而红黑树的时间复杂度最大值(即最坏情况)为O(n) 会明显优于一个较长的链表
另外 当使用无参的构造函数来创建hashmap时 默认的容量为16, 超过16*0.75时 会调用 resize方法进行两倍扩容 ,即32.
0.75是一个比较平均的值 . 如果这个默认加载因子过大 会导致浪费内存 ,而过小会很容易造成hash冲突, 加大链表的长度,影响查询速度.
//hashMap的put方法 通过key值来确定元素的hashCode
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
LinkedHashMap
上面讲了很多hashMap的机制. 但都没有提到hashMap 的遍历. 大多数情况下hashMap是有一定顺序的,但当一个hashMap 中出现了hash冲突,或者某个元素的hashCode 小于之前某个元素 那么就不是顺序输出了.
hashMap的遍历是无序的,并不是按照我们put时候的顺序来进行的,所以引入了LinkedHashMap. 它虽然增加了时间和空间上的开销,但是通过维护一个运行于所有条目的双向链表,LinkedHashMap保证了元素迭代的顺序。该迭代顺序可以是插入顺序或者是访问顺序
首先linkedHashMap是继承自hashMap, 默认情况下其遍历顺序是元素的插入节点顺序. 这是其与hashMap最大的区别. 当然 也可以在构造时传入accessOrder
参数,使得其遍历顺序按照访问的顺序输出
先写到这发了 后续再更 最近因为工作比较忙 没什么时间来整理了.