Collection接口:单列集合,用来存储一个一个的对象
1,List接口:存储有序的,可重复的数据。 -->“动态”数组,替换原有的数组
2,ArrayList:作为List接口的主要实现类,线程不安全,效率高,底层使用Object[] elementData存储
2.1,ArrayList的源码分析:jdk7
ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
list.add(123); //elementData[0] = new Integer(123);
...
list.add(11);//如果此次的添加导致底层elementData数组数组容量不够,则扩容。默认情况下,扩容为原来的容量的1.5倍,同时需要将原有的数据复制到新的数组中。
结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)
2.2,jdk8 中ArrayList的变化:
ArrayList list = new ArrayList();//底层Object[] elementData初始化为{},并没有创建长度为10的数组
list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将123添加到elementData中去
//后续的添加和扩容操作与jdk 7无异
结论:jdk7中的ArrayList的对象的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。
3,LinkedList:对于频繁的插入,删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
3.1, LinkedList的源码分析:
LinkedList list = new LinkedList();内部声明了Node类型的first和last属性,默认值为null
list.add(123);//将123封装到Node中,创建了Node对象。
其中,Node定义为:体现了LinkedList的双向链表的说法
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
4,Vector:作为List接口的古老实现类,线程安全的,效率低,底层使用Object[] elementData存储
4.1,Vector的源码分析:
jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组,在扩容方面,默认扩容为原来的数组长度的2倍
Set接口:存储无序的,不可重复的数据
1,HashSet: 作为Set接口的主要实现类,线程不安全的,可以存储null值
2,LinkedHashSet:作为HashSet的子类:遍历其内部数据时,可以按照添加的顺序遍历。对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
3,TreeSet: 可以按照添加对象的指定属性
3.1 TreeSet:
1,向TreeSet中添加的数据,要求是相同类的对象
2,两种排序方式:自然排序(实现Comparable接口)和定制排序(Comparator)
3,自然排序中,比较两个对象是否相同的标准为:compareTo()返回0,不再是equals()。
4,定制排序中,比较两个对象是否相同的标准为:compare()返回0,不再是equals()。
Set源码分析
Set中无序性: 不等于随机性。存储的数据在底层数据中并非按照数组所以的顺序添加,而是根据数据的哈希值决定的
不可重复性: 保证添加元素按照equals()判断时,不能返回true。即:相同的元素只能添加一个
添加元素的过程: 以HashSet(数组+链表)为例:
我们向HashSet中添加元素a,首先调用元素a所在的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为索引位置),判断数组此位置上是否已经有元素:
情况1 --> 如果此位置上没有其他元素,则元素a添加成功。
如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
情况2 --> 如果hash值不相同,则元素a添加成功。
如果hash值相同,进而需要调用元素a所在类的equals()方法:
equals()方法返回true,元素a添加失败。
情况3 --> equals()方法返回false,则元素a添加成功。
对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上数据以链表的方式存储。
jdk7:元素a放到数组中,指向原来的元素。
jdk8:原来的元素在数组中,指向元素a
总结:七上八下
4.1 Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。
4.2 要求:
重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
重写两个方法的小技巧:对象中用作equals()方法比较的Field,都应该用来计算hashCode值
为什么重写hashCode方法,有31这个数字?
1,选择系数的时候要选择尽量大的系数,因为如果计算出来的hash地址越大,所谓的"冲突"就越少,查找起来效率也会提高。(减少冲突)
2,并且31只占用5bits,相乘造成数据溢出的概率较小。
3,31可以由i*31 == (i << 5)-1来表示,现在很多虚拟机里面都有做相关优化。(提高算法效率)
4,31是一个素数,素数作用就是如果我用一个数字来乘以这个素数,那么最终出来的结果只能被素数本身和被乘数还有1来整除!(减少冲突)