Java容器類框架分析(5)HashSet源碼分析

概述

在分析HashSet源碼前,先看看HashSet的繼承關係api

HashSet繼承關係
HashSet繼承關係

從上圖能夠看出,HashSet繼承自AbstractSet,實現了Set接口,接着看一下源碼中的註釋安全

  • This class implements the Set interface, backed by a hash table
    (actually a HashMapinstance). It makes no guarantees as to the
    iteration order of the set; in particular, it does not guarantee that the
    order will remain constant over time. This class permits the null element.
  • HashSet實現了Set接口,內部有一個哈希表支撐(實際上就是一個HashMap實例),它不保證迭代的順序;尤爲是,隨着時間的變化,它不能保證set的迭代順序保持不變。容許插入空值。

到此發現,HashSet實際上能夠拆分紅Hash跟Set,Hash指的是HashMap,Set則是指實現了Set接口,這樣看來,HashSet的實現其實就比較簡單了,下面開始分析源碼。bash

正文

成員變量

//序列化ID
 static final long serialVersionUID = -5024744406713321676L;
//內置的HashMap
 private transient HashMap<E,Object> map;

 // 就是一個傀儡,填充HashMap的Value而已,沒有實際意義
 private static final Object PRESENT = new Object();複製代碼

構造方法

空的構造方法

初始化一個空的HashMapui

public HashSet() {
        map = new HashMap<>();
    }複製代碼

帶有容量的構造方法

HashMap給定一個容量this

public HashSet(int initialCapacity) {
        map = new HashMap<>(initialCapacity);
    }複製代碼

帶有容量跟負載因子的構造方法

public HashSet(int initialCapacity, float loadFactor) {
        map = new HashMap<>(initialCapacity, loadFactor);
    }複製代碼

帶有容量跟負載因子,以及Value類型區分

dummy做爲Value是基本類型跟引用類型,注意此處初始化的是一個LinkedHashMapspa

HashSet(int initialCapacity, float loadFactor, boolean dummy) {
        map = new LinkedHashMap<>(initialCapacity, loadFactor);
    }複製代碼

經過一個集合初始化

public HashSet(Collection<? extends E> c) {
        map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
        addAll(c);
    }複製代碼

調用addAll方法線程

public boolean addAll(Collection<? extends E> c) {
        boolean modified = false;
        //循環遍歷
        for (E e : c)
        //若是set中沒有此元素,添加成功
            if (add(e))
                modified = true;
        return modified;
    }複製代碼

增長元素

添加一個元素,若是Map中存在,返回false,不然返回truecode

public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }複製代碼

看一下Map的put方法cdn

public V put(K key, V value) {
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);
        }
        if (key == null)
            return putForNullKey(value);
        int hash = sun.misc.Hashing.singleWordWangJenkinsHash(key);
        int i = indexFor(hash, table.length);
        for (HashMapEntry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
        //這裏比較了hash值跟equals方法
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }複製代碼

因此Set元素必須複寫hashcode跟equals方法,否則會致使元素錯亂blog

刪除元素

public boolean remove(Object o) {
  //直接調用map的方法
        return map.remove(o)==PRESENT;
    }複製代碼

clear

public void clear() {
 //調用map的Clear方法
        map.clear();
    }複製代碼

contains方法

public boolean contains(Object o) {
   調用map的contains方法
        return map.containsKey(o);
    }複製代碼

isEmpty

public boolean isEmpty() {
  //調用map的isEmpty方法
        return map.isEmpty();
    }複製代碼

迭代

public Iterator<E> iterator() {
 //由於不須要value,因此只是調用了keySet的iterator
        return map.keySet().iterator();
    }複製代碼

分析了一下,其實最終的底層實現都是在調用HashMap的方法,因此瞭解了HashMap的源碼以後,HashSet其實就會比較簡單了

總結

  • HashSet是非線程安全的,容許插入空元素
  • HashSet不容許重複元素
  • HashSet的Key須要複寫hashcode跟equals方法
相關文章
相關標籤/搜索