Collection:List、SetMap:HashMap、HashTable

基礎知識

在 Java2中,有一套設計優良的接口和類組成了Java集合框架Collection,使程序員操做成批的數據或對象元素極爲方便。這些接口和類有不少對抽象數據類型操做的API,而這是咱們經常使用的且在數據結構中熟知的。例如Map,Set,List等。而且Java用面向對象的設計對這些數據結構和算法進行了封裝,這就極大的減化了程序員編程時的負擔。程序員也能夠以這個集合框架爲基礎,定義更高級別的數據抽象,好比棧、隊列和線程安全的集合等,從而知足本身的須要。 

Java2的集合框架,抽其核心,主要有三種:List、Set和Map。以下圖所示: 

須要注意的是,這裏的 Collection、List、Set和Map都是接口(Interface),不是具體的類實現。 List lst = new ArrayList(); 這是咱們日常常用的建立一個新的List的語句,在這裏, List是接口,ArrayList纔是具體的類。 

經常使用集合類的繼承結構以下: 
Collection<--List<--Vector 
Collection<--List<--ArrayList 
Collection<--List<--LinkedList 
Collection<--Set<--HashSet 
Collection<--Set<--HashSet<--LinkedHashSet 
Collection<--Set<--SortedSet<--TreeSet 
Map<--SortedMap<--TreeMap 
Map<--HashMap 

-----------------------------------------------SB分割線------------------------------------------ 

List: 
List是有序的Collection,使用此接口可以精確的控制每一個元素插入的位置。用戶可以使用索引(元素在List中的位置,相似於數組下 >標)來訪問List中的元素,這相似於Java的數組。 

Vector: 
基於數組(Array)的List,其實就是封裝了數組所不具有的一些功能方便咱們使用,因此它難易避免數組的限制,同時性能也不可能超越數組。因此,在可能的狀況下,咱們要多運用數組。另外很重要的一點就是Vector是線程同步的(sychronized)的,這也是Vector和ArrayList 的一個的重要區別。 

ArrayList: 
同Vector同樣是一個基於數組上的鏈表,可是不一樣的是ArrayList不是同步的。因此在性能上要比Vector好一些,可是當運行到多線程環境中時,可須要本身在管理線程的同步問題。 

LinkedList: 
LinkedList不一樣於前面兩種List,它不是基於數組的,因此不受數組性能的限制。 
它每個節點(Node)都包含兩方面的內容: 
1.節點自己的數據(data); 
2.下一個節點的信息(nextNode)。 
因此當對LinkedList作添加,刪除動做的時候就不用像基於數組的ArrayList同樣,必須進行大量的數據移動。只要更改nextNode的相關信息就能夠實現了,這是LinkedList的優點。 

List總結: java

  • 全部的List中只能容納單個不一樣類型的對象組成的表,而不是Key-Value鍵值對。例如:[ tom,1,c ]

 

  • 全部的List中能夠有相同的元素,例如Vector中能夠有 [ tom,koo,too,koo ]

 

  • 全部的List中能夠有null元素,例如[ tom,null,1 ]

 

  • 基於Array的List(Vector,ArrayList)適合查詢,而LinkedList 適合添加,刪除操做



--------------------------------------NB分割線------------------------------------ 

Set: 
Set是一種不包含重複的元素的無序Collection。 

HashSet: 
雖然Set同List都實現了Collection接口,可是他們的實現方式卻大不同。List基本上都是以Array爲基礎。可是Set則是在 HashMap的基礎上來實現的,這個就是Set和List的根本區別。HashSet的存儲方式是把HashMap中的Key做爲Set的對應存儲項。看看 HashSet的add(Object obj)方法的實現就能夠一目瞭然了。 程序員

Java代碼 算法

public boolean add(Object obj) {   
   return map.put(obj, PRESENT) == null;   
}   

這個也是爲何在Set中不能像在List中同樣有重複的項的根本緣由,由於HashMap的key是不能有重複的。 

LinkedHashSet: 
HashSet的一個子類,一個鏈表。 

TreeSet: 
SortedSet的子類,它不一樣於HashSet的根本就是TreeSet是有序的。它是經過SortedMap來實現的。 

Set總結: 數據庫

  • Set實現的基礎是Map(HashMap)

 

  • Set中的元素是不能重複的,若是使用add(Object obj)方法添加已經存在的對象,則會覆蓋前面的對象



--------------------------------------2B分割線------------------------------------ 

Map: 
Map 是一種把鍵對象和值對象進行關聯的容器,而一個值對象又能夠是一個Map,依次類推,這樣就可造成一個多級映射。對於鍵對象來講,像Set同樣,一個 Map容器中的鍵對象不容許重複,這是爲了保持查找結果的一致性;若是有兩個鍵對象同樣,那你想獲得那個鍵對象所對應的值對象時就有問題了,可能你獲得的並非你想的那個值對象,結果會形成混亂,因此鍵的惟一性很重要,也是符合集合的性質的。固然在使用過程當中,某個鍵所對應的值對象可能會發生變化,這時會按照最後一次修改的值對象與鍵對應。對於值對象則沒有惟一性的要求,你能夠將任意多個鍵都映射到一個值對象上,這不會發生任何問題(不過對你的使用卻可能會形成不便,你不知道你獲得的究竟是那一個鍵所對應的值對象)。 

Map有兩種比較經常使用的實現:HashMap和TreeMap。 

HashMap也用到了哈希碼的算法,以便快速查找一個鍵, 

TreeMap則是對鍵按序存放,所以它便有一些擴展的方法,好比firstKey(),lastKey()等,你還能夠從TreeMap中指定一個範圍以取得其子Map。 
鍵和值的關聯很簡單,用put(Object key,Object value)方法便可將一個鍵與一個值對象相關聯。用get(Object key)可獲得與此key對象所對應的值對象。 

--------------------------------------JB分割線------------------------------------ 

其它: 
1、幾個經常使用類的區別 
1.ArrayList: 元素單個,效率高,多用於查詢 
2.Vector: 元素單個,線程安全,多用於查詢 
3.LinkedList:元素單個,多用於插入和刪除 
4.HashMap: 元素成對,元素可爲空 
5.HashTable: 元素成對,線程安全,元素不可爲空 

2、Vector、ArrayList和LinkedList 
大多數狀況下,從性能上來講ArrayList最好,可是當集合內的元素須要頻繁插入、刪除時LinkedList會有比較好的表現,可是它們三個性能都比不上數組,另外Vector是線程同步的。因此: 
若是能用數組的時候(元素類型固定,數組長度固定),請儘可能使用數組來代替List; 
若是沒有頻繁的刪除插入操做,又不用考慮多線程問題,優先選擇ArrayList; 
若是在多線程條件下使用,能夠考慮Vector; 
若是須要頻繁地刪除插入,LinkedList就有了用武之地; 
若是你什麼都不知道,用ArrayList沒錯。 

3、Collections和Arrays 
在 Java集合類框架裏有兩個類叫作Collections(注意,不是Collection!)和Arrays,這是JCF裏面功能強大的工具,但初學者每每會忽視。按JCF文檔的說法,這兩個類提供了封裝器實現(Wrapper Implementations)、數據結構算法和數組相關的應用。 
想必你們不會忘記上面談到的「折半查找」、「排序」等經典算法吧,Collections類提供了豐富的靜態方法幫助咱們輕鬆完成這些在數據結構課上煩人的工做: 
binarySearch:折半查找。 

sort:排序,這裏是一種相似於快速排序的方法,效率仍然是O(n * log n),但倒是一種穩定的排序方法。 

reverse:將線性表進行逆序操做,這個但是從前數據結構的經典考題哦! 

rotate:以某個元素爲軸心將線性表「旋轉」。 

swap:交換一個線性表中兩個元素的位置。 
…… 
Collections還有一個重要功能就是「封裝器」(Wrapper),它提供了一些方法能夠把一個集合轉換成一個特殊的集合,以下: 

unmodifiableXXX:轉換成只讀集合,這裏XXX表明六種基本集合接口:Collection、List、Map、Set、SortedMap和SortedSet。若是你對只讀集合進行插入刪除操做,將會拋出UnsupportedOperationException異常。 

synchronizedXXX:轉換成同步集合。 

singleton:建立一個僅有一個元素的集合,這裏singleton生成的是單元素Set, 
singletonList和singletonMap分別生成單元素的List和Map。 

空集:由Collections的靜態屬性EMPTY_SET、EMPTY_LIST和EMPTY_MAP表示。 編程

如何在它們之間選擇?

1、Array , Arrays

Java全部「存儲及隨機訪問一連串對象」的作法,array是最有效率的一種。

一、
效率高,但容量固定且沒法動態改變。
array還有一個缺點是,沒法判斷其中實際存有多少元素,length只是告訴咱們array的容量。

二、Java中有一個Arrays類,專門用來操做array。
arrays中擁有一組static函數,
equals():比較兩個array是否相等。array擁有相同元素個數,且全部對應元素兩兩相等。
fill():將值填入array中。
sort():用來對array進行排序。
binarySearch():在排好序的array中尋找元素。
System.arraycopy():array的複製。

2、Collection , Map

若撰寫程序時不知道究竟須要多少對象,須要在空間不足時自動擴增容量,則須要使用容器類庫,array不適用。

一、Collection 和 Map 的區別

容器內每一個爲之所存儲的元素個數不一樣。
Collection類型者,每一個位置只有一個元素。
Map類型者,持有 key-value pair,像個小型數據庫。

二、各自旗下的子類關係

Collection
--List: 將以特定次序存儲元素。因此取出來的順序可能和放入順序不一樣。
--ArrayList / LinkedList / Vector
--Set : 不能含有重複的元素
--HashSet / TreeSet
Map
--HashMap
--HashTable
--TreeMap

三、其餘特徵

* List,Set,Map將持有對象一概視爲Object型別。
* Collection、List、Set、Map都是接口,不能實例化。
繼承自它們的 ArrayList, Vector, HashTable, HashMap是具象class,這些纔可被實例化。
* vector容器確切知道它所持有的對象隸屬什麼型別。vector不進行邊界檢查。

3、Collections

Collections是針對集合類的一個幫助類。提供了一系列靜態方法實現對各類集合的搜索、排序、線程徹底化等操做。
至關於對Array進行相似操做的類——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list); 對list中元素排序

4、如何選擇?

一、容器類和Array的區別、擇取
* 容器類僅能持有對象引用(指向對象的指針),而不是將對象信息copy一份至數列某位置。
* 一旦將對象置入容器內,便損失了該對象的型別信息。

二、
* 在各類Lists中,最好的作法是以ArrayList做爲缺省選擇。當插入、刪除頻繁時,使用LinkedList();
Vector老是比ArrayList慢,因此要儘可能避免使用。
* 在各類Sets中,HashSet一般優於HashTree(插入、查找)。只有當須要產生一個通過排序的序列,才用TreeSet。
HashTree存在的惟一理由:可以維護其內元素的排序狀態。
* 在各類Maps
HashMap用於快速查找。
* 當元素個數固定,用Array,由於Array效率是最高的。

結論:最經常使用的是ArrayList,HashSet,HashMap,Array。

注意:

一、Collection沒有get()方法來取得某個元素。只能經過iterator()遍歷元素。
二、Set和Collection擁有如出一轍的接口。
三、List,能夠經過get()方法來一次取出一個元素。使用數字來選擇一堆對象中的一個,get(0)...。(add/get)
四、通常使用ArrayList。用LinkedList構造堆棧stack、隊列queue。

五、Map用 put(k,v) / get(k),還可使用containsKey()/containsValue()來檢查其中是否含有某個key/value。
HashMap會利用對象的hashCode來快速找到key。
* hashing
哈希碼就是將對象的信息通過一些轉變造成一個獨一無二的int值,這個值存儲在一個array中。
咱們都知道全部存儲結構中,array查找速度是最快的。因此,能夠加速查找。

發生碰撞時,讓array指向多個values。即,數組每一個位置上又生成一個槤表。

六、Map中元素,能夠將key序列、value序列單獨抽取出來。
使用keySet()抽取key序列,將map中的全部keys生成一個Set。
使用values()抽取value序列,將map中的全部values生成一個Collection。

爲何一個生成Set,一個生成Collection?那是由於,key老是獨一無二的,value容許重複數組

參考:Java Collection安全

相關文章
相關標籤/搜索