Collection接口 Map接口 HashTable類

時間 2019-11-20

標籤 collection 接口 map hashtable 欄目 Java 简体版

原文原文鏈接

順序表，鏈表，哈希表是經常使用的數據結構，在進行Java開發時，JDK已經爲咱們提供了一系列相應的類來實現基本的數據結構。這些類均在java.util包中。本文經過簡單的描述，向讀者闡述各個類的做用以及如何正確使用這些類。 java

Collection接口
├List接口
│ ├LinkedList類
│ ├ArrayList類
│ └Vector類
│　 └Stack類
└Set接口算法

實現Map接口的類中有一個類是AbstractMap類。編程

Map接口
└AbstractMap類
   ├HashMap類
   ├TreeMap類
   └WeakHashMap類數組

HashTable類數據結構

詳解：函數

1、Collection接口

Collection接口（即集合接口）是最基本的集合接口（可是這個集合和數據結構中的非線性結構的集合有區別，不是一個概念。Java中的集合接口我認爲能夠看做是對應於數據結構中的線性結構），一個Collection表明一組Object（對象），即Collection的元素（Elements）。性能

爲何要用到容器？由於若是隻有數組的話，數組有缺陷，有兩個缺陷：①數組長度難以擴充；②數組中元素類型必須相同。測試

什麼是容器？容器是一個類，相似於數組，可是彌補了數組的兩個缺陷，並且容器這個類建立的對象可以裝對象。優化

數學上，集合類型能夠概括爲三種：spa

一、集（Set，也即Set接口）

Set集合中不區分元素的順序，不容許出現重複元素。我感受Set接口也是線性結構，可是其子類通常用哈希存儲來實現。
實現類：TreeSet HashSet

二、列表（List，也即List接口）

注意List不表示鏈表（鏈式列表）的意思，我感受List接口就是數據結構中的邏輯結構中的線性結構。包含兩種：①ArrayList（用數組實現線性表的順序存儲）②LinkedList（用鏈表實現線性表的鏈式存儲）。能夠結合考研複習總結的那張圖來記憶，即：線性結構中的線性表，分爲順序表和鏈表。
List集合區分元素的順序，且容許包含重複元素。
實現類：ArrayList LinkedList

三、映射（Map，也即Map接口）

映射中保存成對的「鍵-值」（Key-Value）信息，映射中不能包含重複的鍵，每一個鍵最多隻能映射一個值。
實現類：HashMap TreeMap

Java設計了三個接口來對應集合上的三種集合類型，這三個接口名字分別是List Set Map。

J2SDK提供的容器API位於java.util包內。

容器API的類圖結構以下圖所示：

一些Collection接口容許相同的元素而另外一些不行。一些能排序而另外一些不行。Java SDK不提供直接實現Collection接口的類，Java SDK提供的類都是繼承自Collection接口的「子接口」如List接口和Set接口。

全部實現Collection接口的類都必須提供兩個標準的構造函數：無參數的構造函數用於建立一個空的Collection，有一個Collection參數的構造函數用於建立一個新的Collection，這個新的Collection與傳入的Collection有相同的元素。後一個構造函數容許用戶複製一個Collection。

如何遍歷Collection中的每個元素？不論Collection集合中存放的對象是引用數據類型中的哪種，Collection接口都支持一個叫作iterator()的方法，該方法返回一個迭代子，使用該迭代子便可逐一訪問Collection中的每個元素。典型的用法以下：

Iterator it = collection.iterator(); // 獲取一個迭代子
while (it.hasNext()) {
    Object obj = it.next();          // 獲取下一個元素　　　
}

由Collection接口派生的兩個接口是List和Set。

一、List接口

List接口是有序的Collection接口，即list集合中存放元素的時候是有序存放的，因此list集合中能夠存放相同的對象，也使得使用此接口可以精確地控制每一個元素插入的位置。用戶可以使用索引（元素在List中的位置，相似於數組下標）來訪問List接口中的元素，這相似於Java的數組。List集合能夠放入null。

和下面要提到的Set接口不一樣，List接口容許有相同的元素。

除了具備Collection接口必備的iterator()方法外，List接口還提供一個listIterator()方法，返回一個ListIterator接口，和標準的Iterator接口相比，ListIterator多了一些add()之類的方法，容許添加，刪除，設定元素，還能向前或向後遍歷。

實現List接口的經常使用類有LinkedList類，ArrayList類，Vector類和Stack類。

1.1 LinkedList類

LinkedList其實是一個雙向連接列表。LinkedList類實現了List接口，容許null元素。此外LinkedList提供額外的get()，remove()，insert()成員方法在LinkedList的首部或尾部。這些操做使LinkedList可被用做實現堆棧（stack），隊列（queue）或雙向隊列（deque）的功能。

注意LinkedList沒有同步方法。若是多個線程同時訪問一個List，則必須本身實現訪問同步。一種解決方法是在建立List時構造一個同步的List：

List list = Collections.synchronizedList(new LinkedList(...));

1.2 ArrayList類

ArrayList實現了可變大小的數組，數組是最簡單的順序表。ArrayList也是順序表，可是其是基於集合體系的。在JDK7.0中有4大集合體系：①List體系，②Set體系，③Map體系，④Queue體系（JDK 7.0新增）。它容許全部元素，含有null。ArrayList沒有同步。

size()，isEmpty()，get()，set()方法運行時間爲常數。可是add()方法開銷爲分攤的常數，添加n個元素須要O(n)的時間。其餘的方法運行時間爲線性。

每一個ArrayList實例都有一個容量（Capacity），即用於存儲元素的數組的大小。這個容量可隨着不斷添加新元素而自動增長，可是增加算法並無定義。當須要插入大量元素時，在插入前能夠調用ensureCapacity方法來增長ArrayList的容量以提升插入效率。

和LinkedList同樣，ArrayList也是非同步的（unsynchronized）。

1.3 Vector類

Vector很是相似ArrayList，可是Vector是同步的。由Vector建立的Iterator，雖然和ArrayList建立的Iterator是同一接口，可是，由於Vector是同步的，當一個Iterator被建立並且正在被使用，另外一個線程改變了Vector的狀態（例如，添加或刪除了一些元素），這時調用Iterator的方法時將拋出ConcurrentModificationException，所以必須捕獲該異常。

1.3.1 Stack類

Stack類繼承自Vector類，實現一個後進先出的堆棧。Stack類提供5個額外的方法使得Vector得以被看成堆棧使用。基本的push()和pop()方法，還有peek()方法獲得棧頂的元素，empty()方法測試堆棧是否爲空，search()方法檢測一個元素在堆棧中的位置。Stack類剛建立後是空棧。

二、Set接口

Set接口是一種不含有重複的元素的Collection，即任意的兩個元素e1和e2都有e1.equals(e2)=false，Set最多有一個null元素。

很明顯，Set的構造函數有一個約束條件，傳入的Collection參數不能含有重複的元素。

請注意：必須當心操做可變對象（Mutable Object）。若是一個Set中的可變元素改變了自身狀態致使Object.equals(Object)=true將致使一些問題。

Set集合中的元素無放入順序，元素不可重複（注意：元素雖然無放入順序，可是元素在set中的位置是有該元素的HashCode決定的，其位置實際上是固定的）。

2、Map接口

請注意，Map接口沒有繼承Collection接口，而是獨立的一個接口，Map接口提供key到value的映射。Map集合是無序的，能夠放入null。一個Map接口中不能含有相同的key，每一個key只能映射一個value。但map集合中能夠放入相同的對象。Map接口提供3種集合的視圖，Map的內容能夠被看成一組key集合，一組value集合，或者一組key-value映射。Map是一種把鍵對象和值對象進行關聯的容器，而一個值對象又能夠是一個Map，依次類推，這樣就可造成一個多級映射。對於鍵對象來講，像Set同樣，一個Map容器中的鍵對象不容許重複，這是爲了保持查找結果的一致性；若是有兩個鍵對象同樣，那你想獲得那個鍵對象所對應的值對象時就有問題了，可能你獲得的並非你想的那個值對象，結果會形成混亂，因此鍵的惟一性很重要，也是符合集合的性質的。固然在使用過程當中，某個鍵所對應的值對象可能會發生變化，這時會按照最後一次修改的值對象與鍵對象對應。對於值對象則沒有惟一性的要求。你能夠將任意多個鍵對象都映射到一個值對象上，這不會發生任何問題（不過對你的使用卻可能會形成不便，你不知道你獲得的究竟是哪個鍵所對應的值對象）。Map接口有兩種比較經常使用的實現類：HashMap和TreeMap。HashMap也用到了哈希碼的算法，以便快速查找一個鍵，TreeMap則是對鍵按序存放，所以它便有一些擴展的方法，好比firstKey()，lastKey()等，你還能夠從TreeMap類中指定一個範圍以取得其子Map。鍵和值的關聯很簡單，用pub(Object key,Object value)方法便可將一個鍵對象與一個值對象相關聯。用get(Object key)可獲得與此key對象所對應的值對象。

二、AbstractMap類

AbstractMap抽象類：覆蓋了equals()和hashCode()方法以確保兩個相等映射返回相同的哈希碼。若是兩個映射大小相等、包含一樣的鍵且每一個鍵在這兩個映射中對應的值都相同，則這兩個映射相等。映射的哈希碼是映射元素哈希碼的總和，其中每一個元素是Map.Entry接口的一個實現。所以，不論映射內部順序如何，兩個相等映射會報告相同的哈希碼。

2.1 HashMap類

HashMap：基於哈希表實現。使用HashMap要求添加的鍵類明肯定義了hashCode()和equals()（注：能夠重寫hashCode()和equals()兩個方法），爲了優化HashMap空間的使用，您能夠調優初始容量和負載因子。

(1)HashMap():構建一個空的哈希映像。

(2)HashMap(Map m):構建一個哈希映像，而且添加映像m的全部映射。

(3)HashMap(int initialCapacity):構建一個擁有特定容量的空的哈希映像。

(4)HashMap(int initialCapacity, float loadFactor): 構建一個擁有特定容量和加載因子的空的哈希映像。　　

HashMap類和Hashtable相似（我理解爲圖的散列存儲，即圖的哈希存儲）（我理解爲類是接口的實現），不一樣之處在於HashMap類是非同步的，而且容許null，即null value和null key。可是將HashMap類視爲Collection時（values()方法可返回Collection），其迭代器操做時間開銷和HashMap類的容量成比例。所以，若是迭代操做的性能至關重要的話，不要將HashMap類的初始化容量設得太高，或者load factor太低。

2.2 TreeMap

基於紅黑樹（是一種自平衡二叉查找樹）實現。TreeMap沒有調優選項，由於該樹總處於平衡狀態。

(1)TreeMap()：構建一個空的映像樹。

(2)TreeMap(Map m)：構建一個映像樹，而且添加映像m中全部元素。

(3)TreeMap(Comparator c): 構建一個映像樹，而且使用特定的比較器對關鍵字進行排序。

(4)TreeMap(SortedMap s) ：構建一個映像樹，添加映像樹s中全部映射，而且使用與有序映像s相同的比較器排序。

2.3 WeakHashMap類

WeakHashMap類是一種改進的HashMap，它對key實行「弱引用」，若是一個key再也不被外部所引用，那麼該key能夠被GC回收。

總結

若是涉及到堆棧（即棧），隊列等操做，應該用List接口。若是須要快速隨機訪問元素，應該使用ArrayList（我理解爲集合的順序存儲）類；若是須要快速插入、刪除元素的時候，應該使用LinkedList（我理解爲集合的鏈式存儲）類。

若是程序在單線程環境中，或者訪問僅僅在一個線程中進行，應該用非同步的類，其效率較高，若是多個線程可能同時操做一個類，應該使用同步的類。

要特別注意對哈希表的操做，做爲key的對象要正確複寫equals和hashCode方法。

儘可能返回接口而非實際的類型，如返回List（接口）而非ArrayList（類），這樣若是之後須要將ArrayList換成LinkedList時，客戶端代碼不用改變。這就是針對抽象編程。

3、Hashtable類

Hashtable類實現Map接口，實現一個key-value映射的哈希表。任何非空（non-null）的對象均可做爲key或者value。

在添加（或叫插入）數據時，使用put(key, value)方法，這是Map接口與Collection接口的區別，由於Collection集合中添加的是一個個的對象，而Map中添加的是鍵值對，是兩個東西，若是用add()方法容易產生歧義，因此就用的是put()方法。獲取數據使用get(key)方法，這兩個基本操做的時間開銷爲常數。
Hashtable經過initial capacity和load factor兩個參數調整性能。一般缺省的load factor 0.75較好地實現了時間和空間的均衡。增大load factor能夠節省空間但相應的查找時間將增大，這會影響像get和put這樣的操做。
使用Hashtable的簡單示例以下，將1，2，3放到Hashtable中，他們的key分別是」one」，」two」，」three」：

Hashtable numbers = new Hashtable();
numbers.put(「one」, new Integer(1));
numbers.put(「two」, new Integer(2));
numbers.put(「three」, new Integer(3));

要取出一個數，好比2，用相應的key：

Integer n = (Integer) numbers.get(「two」);　　
System.out.println(「two = 」 + n);

因爲做爲key的對象將經過計算其散列函數來肯定與之對應的value的位置，所以任何做爲key的對象都必須實現hashCode()和equals()方法。hashCode()和equals()方法繼承自根類Object，若是你用自定義的類看成key的話，要至關當心，按照散列函數的定義，若是兩個對象相同，即obj1.equals(obj2)=true，則它們的hashCode()必須相同，但若是兩個對象不一樣，則它們的hashCode()不必定不一樣，若是兩個不一樣對象的hashCode()相同，這種現象稱爲衝突，衝突會致使操做哈希表的時間開銷增大，因此儘可能定義好的hashCode()方法，能加快哈希表的操做。
　　若是相同的對象有不一樣的hashCode，對哈希表的操做會出現意想不到的結果（期待的get方法返回null），要避免這種問題，只須要牢記一條：要同時重寫equals()方法和hashCode()方法，而不要只寫其中一個。總結：只要是hash開頭的，都要重寫hashCode()方法和equals()方法。
　　Hashtable是同步的。

HashMap TreeMap 的比較：

2. Map接口的兩種常規實現類（分別繼承自AbstractMap和SortedMap)

3.兩種常規Map性能

HashMap：適用於在Map中插入、刪除和定位元素。

Treemap：適用於按天然順序或自定義順序遍歷鍵(key)。

4.總結：HashMap一般比TreeMap快一點(樹和哈希表的數據結構使然)，建議多使用HashMap，在須要排序的Map時候才用TreeMap。

Collection(容器)接口及其子接口、實現類，通常與如下一個類和兩個接口聯合使用，即：Collections類；Comparable接口、Iterator接口。

Collections類：該類提供了對Collection接口實現類的排序，倒置、查找等功能。

Comparable接口：經過該接口的方法能夠制訂出對象之間比較的標準。凡是須要進行對象的比較排序的場合都可以考慮實現該接口。

Iterator接口：利用該接口提供的方法（這些方法不須要本身實現，直接調用便可）咱們能夠遍歷全部容器（無論是以上講的哪一種容器）中的元素。

SortedMap接口

SortedMap接口：它用來保持鍵的有序順序。SortedMap接口爲映像的視圖(子集)，包括兩個端點提供了訪問方法。除了排序是做用於映射的鍵之外，處理SortedMap和處理SortedSet同樣。添加到SortedMap實現類的元素必須實現Comparable接口，不然您必須給它的構造函數提供一個Comparator接口的實現。TreeMap類是它的惟一一份實現。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。