Set
接下来会逐一介绍Set集合中的一下3个比较重要
- HashSet(本文中讲解)
- LinkedHashSet(后续)
- TreeSet(后续)
HashSet
- 特点
- 底层是由HashMap实现的,相关方法直接调用底层HashMap的方法(详细的分析会在后续Map文章中)
- 无序且唯一,这里的无序是每存入的元素可能会打乱之前的顺序,这里的唯一是通过equals和哈希表保证
- 各种的快,可以有一个元素为null
首先来一段测试代码
package site.tian;
import java.util.HashSet;
public class MyHashSet {
public static void main(String[] args) {
HashSet hashSets = new HashSet();
hashSets.add("熊大");
hashSets.add("熊二");
hashSets.add("张三");
hashSets.add("李四");
hashSets.add("王五");
hashSets.add("赵六");
hashSets.add("熊大");
for (Object o : hashSets) {
System.out.print(o+" ");
}
}
}
输出结果:李四 张三 熊大 王五 赵六 熊二
可以看出:元素唯一,不重复 (两个熊大输出一个)
上图片
体系结构
存储示意图:左侧可以看成数组结构(哈希表),右侧看作链表
任何一个对象都可以通过hashCode()方法通过计算生成一串数字,但两个不同的对象通过计算也有可能得出同样的一串数字,为保证元素唯一都能存入集合中,再次通过equas()方法进一步判断,若比较内容不一样,证明两个对象确实不一样,就在该元素下生成一个链表存储(在jdk1.8后为了提高效率,链存存储在达到一定条件后链表转化为红黑树(自平衡二叉树)存储)
上代码
add方法
public static void main(String[] args) {
HashSet hashSets = new HashSet();
hashSets.add("熊大");//跟进源码
}
//在HashSet类中nwe了一个HashMap
private transient HashMap<E,Object> map;
public boolean add(E e) {
//实际上调用了msqp的put方法,PRESENT是一个Object对象在这里没有实际作用(因为HashMap的put方法要求以键值对的方式,我们的元素其实是存储到key中)
return map.put(e, PRESENT)==null;
}
public V put(K key, V value) {
//对key进行了hash计算
return putVal(hash(key), key, value, false, true);
}
//
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
····
····
//这里可以验证确实是由hash值和equals()方法共同决定两个对象是否相等(更加详细的源码解释会在HashMap中详细讲述)
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
····
····
}
删除方法
public boolean remove(Object o) {
//同样调用了HashMap的remove方法(这里不再累赘,在后续HashMap中将详细讲解)
return map.remove(o)==PRESENT;
}
HashSet实现方法以及遍历等操作,从源码中我们可以看出实际上HashSet就是对HashMap进行了一次封装,探究其原理还是要从HashMap中下手,但是在实际应用中使用HashSet一般我们需要重写eques方法和hashCode方法自定义它实现唯一的规则