<section data-role="outer" label="Powered by 135editor.com">html
<section data-role="outer" label="Powered by 135editor.com">程序員
點擊上方「程序員江湖」,選擇「置頂或者星標」面試
你關注的就是我關心的!算法
Java集合類絕對是咱們的老朋友了,Java技術江湖裏,誰人不知,誰人不曉,它的使用率很是高,使用難度卻也不大,這也致使了不少人對它不屑一顧,卻不知其中卻暗藏玄機,今天咱們不妨一塊兒來破解一下Java集合類的面試題。數據庫
只見面試官微微一笑,拔出長劍,向你刺來,你趕忙拔劍相迎,幾招事後,你才意識到面試官使的都是虛招,只是試探你而已。api
<pre>數組
Collection爲集合層級的根接口。一個集合表明一組對象,這些對象即爲它的元素。Java平臺不提供這個接口任何直接的實現。
Set是一個不能包含重複元素的集合。這個接口對數學集合抽象進行建模,被用來表明集合,就如一副牌。
List是一個有序集合,能夠包含重複元素。你能夠經過它的索引來訪問任何元素。List更像長度動態變換的數組。
Map是一個將key映射到value的對象.一個Map不能包含重複的key:每一個key最多隻能映射一個value。
一些其它的接口有Queue、Dequeue、SortedSet、SortedMap和ListIterator。
</pre>緩存
(1)咱們可使用Iterator來遍歷Set和List集合,而ListIterator只能遍歷List。安全
(2)Iterator只能夠向前遍歷,而LIstIterator能夠雙向遍歷。數據結構
(3)ListIterator從Iterator接口繼承,而後添加了一些額外的功能,好比添加一個元素、替換一個元素、獲取前面或後面元素的索引位置。
<pre>
List<String> strList = new ArrayList<>();
for(String obj : strList){ System.out.println(obj); }
Iterator<String> it = strList.iterator();
while(it.hasNext()){ String obj = it.next(); System.out.println(obj); }
</pre>
使用迭代器更加線程安全,由於它能夠確保,在當前遍歷的集合元素被更改的時候,它會拋出ConcurrentModificationException。
<pre>
HashMap在Map.Entry靜態內部類實現中存儲key-value對。HashMap使用哈希算法,在put和get方法中,它使用hashCode()和equals()方法。當咱們經過傳遞key-value對調用put方法的時候,HashMap使用Key hashCode()和哈希算法來找出存儲key-value對的索引。Entry存儲在LinkedList中,因此若是存在entry,它使用equals()方法來檢查傳遞的key是否已經存在,若是存在,它會覆蓋value,若是不存在,它會建立一個新的entry而後保存。當咱們經過傳遞key調用get方法時,它再次使用hashCode()來找到數組中的索引,而後使用equals()方法找出正確的Entry,而後返回它的值。下面的圖片解釋了詳細內容。
其它關於HashMap比較重要的問題是容量、負荷係數和閥值調整。HashMap默認的初始容量是32,負荷係數是0.75。閥值是爲負荷係數乘以容量,不管什麼時候咱們嘗試添加一個entry,若是map的大小比閥值大的時候,HashMap會對map的內容進行從新哈希,且使用更大的容量。容量老是2的冪,因此若是你知道你須要存儲大量的key-value對,好比緩存從數據庫裏面拉取的數據,使用正確的容量和負荷係數對HashMap進行初始化是個不錯的作法。
</pre>
<pre>
HashMap使用Key對象的hashCode()和equals()方法去決定key-value對的索引。當咱們試着從HashMap中獲取值的時候,這些方法也會被用到。若是這些方法沒有被正確地實現,在這種狀況下,兩個不一樣Key也許會產生相同的hashCode()和equals()輸出,HashMap將會認爲它們是相同的,而後覆蓋它們,而非把它們存儲到不一樣的地方。一樣的,全部不容許存儲重複數據的集合類都使用hashCode()和equals()去查找重複,因此正確實現它們很是重要。equals()和hashCode()的實現應該遵循如下規則:
</pre>
(1)若是o1.equals(o2),那麼o1.hashCode() == o2.hashCode()老是爲true的。
(2)若是o1.hashCode() == o2.hashCode(),並不意味着o1.equals(o2)會爲true。
<pre>
咱們可使用任何類做爲Map的key,然而在使用它們以前,須要考慮如下幾點:
</pre>
(1)若是類重寫了equals()方法,它也應該重寫hashCode()方法。
(2)類的全部實例須要遵循與equals()和hashCode()相關的規則。請參考以前提到的這些規則。
(3)若是一個類沒有使用equals(),你不該該在hashCode()中使用它。
(4)用戶自定義key類的最佳實踐是使之爲不可變的,這樣,hashCode()值能夠被緩存起來,擁有更好的性能。不可變的類也能夠確保hashCode()和equals()在將來不會改變,這樣就會解決與可變相關的問題了。
<pre>
好比,我有一個類MyKey,在HashMap中使用它。
//傳遞給MyKey的name參數被用於equals()和hashCode()中 MyKey key = new MyKey('Pankaj'); //assume hashCode=1234 myHashMap.put(key, 'Value'); // 如下的代碼會改變key的hashCode()和equals()值 key.setName('Amit'); //assume new hashCode=7890 //下面會返回null,由於HashMap會嘗試查找存儲一樣索引的key,而key已被改變了,匹配失敗,返回null myHashMap.get(new MyKey('Pankaj'));
那就是爲什麼String和Integer被做爲HashMap的key大量使用。
</pre>
(1)HashMap容許key和value爲null,而HashTable不容許。
(2)HashTable是同步的,而HashMap不是。因此HashMap適合單線程環境,HashTable適合多線程環境。
(3)在Java1.4中引入了LinkedHashMap,HashMap的一個子類,假如你想要遍歷順序,你很容易從HashMap轉向LinkedHashMap,可是HashTable不是這樣的,它的順序是不可預知的。
(4)HashMap提供對key的Set進行遍歷,所以它是fail-fast的,但HashTable提供對key的Enumeration進行遍歷,它不支持fail-fast。
(5)HashTable被認爲是個遺留的類,若是你尋求在迭代的時候修改Map,你應該使用CocurrentHashMap。
<pre>
ArrayList和Vector在不少時候都很相似。
</pre>
(1)二者都是基於索引的,內部由一個數組支持。
(2)二者維護插入的順序,咱們能夠根據插入順序來獲取元素。
(3)ArrayList和Vector的迭代器實現都是fail-fast的。
(4)ArrayList和Vector二者容許null值,也可使用索引值對元素進行隨機訪問。
<pre>
如下是ArrayList和Vector的不一樣點。
</pre>
(1)Vector是同步的,而ArrayList不是。然而,若是你尋求在迭代的時候對列表進行改變,你應該使用CopyOnWriteArrayList。
(2)ArrayList比Vector快,它由於有同步,不會過載。
(3)ArrayList更加通用,由於咱們可使用Collections工具類輕易地獲取同步列表和只讀列表。
<pre>
Array能夠容納基本類型和對象,而ArrayList只能容納對象。
Array是指定大小的,而ArrayList大小是固定的。
Array沒有提供ArrayList那麼多功能,好比addAll、removeAll和iterator等。儘管ArrayList明顯是更好的選擇,但也有些時候Array比較好用。
</pre>
(1)若是列表的大小已經指定,大部分狀況下是存儲和遍歷它們。
(2)對於遍歷基本數據類型,儘管Collections使用自動裝箱來減輕編碼任務,在指定大小的基本類型的列表上工做也會變得很慢。
(3)若是你要使用多維數組,使用[][]比List<list<>>更容易。</list<>
<pre>
ArrayList和LinkedList二者都實現了List接口,可是它們之間有些不一樣。
</pre>
(1)ArrayList是由Array所支持的基於一個索引的數據結構,因此它提供對元素的隨機訪問,複雜度爲O(1),但LinkedList存儲一系列的節點數據,每一個節點都與前一個和下一個節點相鏈接。因此,儘管有使用索引獲取元素的方法,內部實現是從起始點開始遍歷,遍歷到索引的節點而後返回元素,時間複雜度爲O(n),比ArrayList要慢。
(2)與ArrayList相比,在LinkedList中插入、添加和刪除一個元素會更快,由於在一個元素被插入到中間的時候,不會涉及改變數組的大小,或更新索引。
(3)LinkedList比ArrayList消耗更多的內存,由於LinkedList中的每一個節點存儲了先後節點的引用。
<pre>
Vector、HashTable、Properties和Stack是同步類,因此它們是線程安全的,能夠在多線程環境下使用。Java1.5併發API包括一些集合類,容許迭代時修改,由於它們都工做在集合的克隆上,因此它們在多線程環境中是安全的。
</pre>
<pre>
Java.util.Collections是一個工具類僅包含靜態方法,它們操做或返回集合。它包含操做集合的多態算法,返回一個由指定集合支持的新集合和其它一些內容。這個類包含集合框架算法的方法,好比折半搜索、排序、混編和逆序等。
</pre>
<pre>
Comparable和Comparator接口被用來對對象集合或者數組進行排序。Comparable接口被用來提供對象的天然排序,咱們可使用它來提供基於單個邏輯的排序。
Comparator接口被用來提供不一樣的排序算法,咱們能夠選擇須要使用的Comparator來對給定的對象集合進行排序。
</pre>
<pre>
若是咱們須要對一個對象數組進行排序,咱們可使用Arrays.sort()方法。若是咱們須要排序一個對象列表,咱們可使用Collection.sort()方法。兩個類都有用於天然排序(使用Comparable)或基於標準的排序(使用Comparator)的重載方法sort()。Collections內部使用數組排序方法,全部它們二者都有相同的性能,只是Collections須要花時間將列表轉換爲數組。
</pre>
面試官見你應對自如,知道你也不是等閒之輩,因而眼神也變得專一起來,因而大家雙雙躍起,在空中展開廝鬥,雖然面試官每一招都很是到位,可是你依然能夠與之抗衡。
HashMap本身實現了本身的hash()方法,經過兩次擾動使得它本身的哈希值高低位自行進行異或運算,下降哈希碰撞機率也使得數據分佈更平均;
在保證數組長度爲2的冪次方的時候,使用hash()運算以後的值與運算(&)(數組長度 - 1)來獲取數組下標的方式進行存儲,這樣一來是比取餘操做更加有效率,二來也是由於只有當數組長度爲2的冪次方時,h&(length-1)纔等價於h%length,三來解決了「哈希值與數組大小範圍不匹配」的問題;
只有當數組長度爲2的冪次方時,h&(length-1)纔等價於h%length,即實現了key的定位,2的冪次方也能夠減小衝突次數,提升HashMap的查詢效率;
若是 length 爲 2 的次冪 則 length-1 轉化爲二進制一定是 11111……的形式,在於 h 的二進制與操做效率會很是的快,並且空間不浪費;若是 length 不是 2 的次冪,好比 length 爲 15,則 length - 1 爲 14,對應的二進制爲 1110,在於 h 與操做,最後一位都爲 0 ,而 0001,0011,0101,1001,1011,0111,1101 這幾個位置永遠都不能存放元素了,空間浪費至關大,更糟的是這種狀況中,數組可使用的位置比數組長度小了不少,這意味着進一步增長了碰撞的概率,減慢了查詢的效率!這樣就會形成空間的浪費。
答:在JDK1.7中,ConcurrentHashMap採用Segment + HashEntry的方式進行實現,結構以下:
該類包含兩個靜態內部類 HashEntry 和 Segment ;前者用來封裝映射表的鍵值對,後者用來充當鎖的角色; Segment 是一種可重入的鎖 ReentrantLock,每一個 Segment 守護一個HashEntry 數組裏得元素,當對 HashEntry 數組的數據進行修改時,必須首先得到對應的 Segment 鎖。
在JDK1.8中,放棄了Segment臃腫的設計,取而代之的是採用Node + CAS + Synchronized來保證併發安全進行實現,結構以下:
插入元素過程(建議去看看源碼):
若是相應位置的Node尚未初始化,則調用CAS插入相應的數據;
<pre>
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
</pre>
若是相應位置的Node不爲空,且當前該節點不處於移動狀態,則對該節點加synchronized鎖,若是該節點的hash不小於0,則遍歷鏈表更新節點或插入新節點;
<pre>
if (fh >= 0) {
binCount = 1;
for (Node<K,V> e = f;; ++binCount) {
K ek;
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
if (!onlyIfAbsent)
e.val = value;
break;
}
Node<K,V> pred = e;
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key, value, null);
break;
}
}
}
</pre>
若是該節點是TreeBin類型的節點,說明是紅黑樹結構,則經過putTreeVal方法往紅黑樹中插入節點;若是binCount不爲0,說明put操做對數據產生了影響,若是當前鏈表的個數達到8個,則經過treeifyBin方法轉化爲紅黑樹,若是oldVal不爲空,說明是一次更新操做,沒有對元素個數產生影響,則直接返回舊值; 若是插入的是一個新節點,則執行addCount()方法嘗試更新元素個數baseCount;
答:經過分析源碼咱們知道了HashMap經過resize()方法進行擴容或者初始化的操做,下面是對源碼進行的一些簡單分析:
<pre>
/**
* 該函數有2中使用狀況:1.初始化哈希表;2.當前數組容量太小,須要擴容
*/
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;// 擴容前的數組(當前數組)
int oldCap = (oldTab == null) ? 0 : oldTab.length;// 擴容前的數組容量(數組長度)
int oldThr = threshold;// 擴容前數組的閾值
int newCap, newThr = 0;
if (oldCap > 0) {
// 針對狀況2:若擴容前的數組容量超過最大值,則再也不擴容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 針對狀況2:若沒有超過最大值,就擴容爲原來的2倍(左移1位)
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
// 針對狀況1:初始化哈希表(採用指定或者使用默認值的方式)
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 計算新的resize上限
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
// 把每個bucket都移動到新的bucket中去
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
</pre>
雖然剛剛的打鬥確實激烈,招式也十分好看,可是背後隱藏着的武學基礎倒是有共同之處的。在本篇裏指的即是Java集合類的基礎知識點。
其實Java集合類的面試題遠不止如此,面試官可能會問你每一個實現細節,因此即便你見過了全部的面試題型,而且都緊緊記住,那又有什麼用呢,不能理解其原理,光會表面招式,最後就會被輕易擊敗。
下面咱們不妨就見招拆招,說Java集合類裏的那些基礎、門道以及正確掌握這部份內容的方法。
第一次接觸集合類,遇到的是ArrayList,當時連<>表明泛型都不知道,讓我new一個ArrayList對象都不利索,直到開始瞭解到它的api,才感受其實這個玩意也並非很複雜呀,不就是put,get等一些看起來就很簡單的方法嗎。
抱着這樣的想法,我開始在一些項目和練習題中使用ArrayList,用法確實不難,正常狀況咱們只須要使用put,get,remove等方法,不過有時候也會遇到一些問題,好比你在用for循環刪除ArrayList的元素時,就會發現,若是你按照下標來刪除,是會報錯的,這就讓我很頭大了,不理解其實現原理,光會用api,看來仍是不行啊。
我一直認爲,面試是學習的一大動力,當時爲了面試大廠,確實也看了不少面試題,集合類是跨不過去的一道坎,而且須要深刻到源碼裏去理解,好比hashmap的底層原理,絕對是大場面試中最愛考的一道題目,因而我跟着幾位大牛的博客(後面有推薦)複習了一整遍hashmap的實現原理,理解了80%左右的內容,這纔可以應付大廠的面試題。
當你理解了整個hashmap的實現原理以後,你就會發現大部分面試題都難不倒你了。我本身作了一個總結,每當面試官問我「JDK裏的hashmap是怎麼實現的」我基本上都會用如下內容作回答。
固然,這僅供參考,切不可死記硬背,畢竟這只是我本身理解後整理出來的東西。
hashmap是數組和鏈表的組合結構,數組是一個Entry數組,entry是k-V鍵值對類型,因此一個entry數組存着很entry節點,一個entry的位置經過key的hashcode方法,再進行hash(移位等操做),最後與表長-1進行相與操做,其實就是取hash值到的後n - 1位,n表明表長是2的n次方。hashmap的默認負載因子是0.75,閾值是16 * 0.75 = 12;初始長度爲16;
hashmap的增刪改查方式比較簡單,都是遍歷,替換。有一點要注意的是key相等時,替換元素,不相等時連成鏈表。
除此以外,1.8jdk改進了hashmap,當鏈表上的元素個數超過8個時自動轉化成紅黑樹,節點變成樹節點,以提升搜索效率和插入效率到logn。
還有一點值得一提的是,hashmap的擴容操做,因爲hashmap非線程安全,擴容時若是多線程併發進行操做,則可能有兩個線程分別操做新表和舊錶,致使節點成環,查詢時會造成死鎖。chm避免了這個問題。
另外,擴容時會將舊錶元素移到新表,原來的版本移動時會有rehash操做,每一個節點都要rehash,很是不方便,而1.8改爲另外一種方式,對於同一個index下的鏈表元素,因爲一個元素的hash值在擴容後只有兩種狀況,要麼是hash值不變,要麼是hash值變爲原來值+2^n次方,這是由於表長翻倍,因此hash值取後n位,第一位要麼是0要麼是1,因此hash值也只有兩種狀況。這兩種狀況的元素分別加到兩個不一樣的鏈表。這兩個鏈表也只須要分別放到新表的兩個位置便可,是否是很酷。
最後有一個比較冷門的知識點,hashmap1.7版本鏈表使用的是節點的頭插法,擴容時轉移鏈表仍然使用頭插法,這樣的結果就是擴容後鏈表會倒置,而hashmap.1.8在插入時使用尾插法,擴容時使用頭插法,這樣能夠保證順序不變。
一、個人博客專欄【深刻淺出Java核心技術】(包括我創做和整理的文章,涵蓋集合類內容)
https://blog.csdn.net/a724888...
二、集合類寫的比較好的博主:chenssy(cmsblog)、佔小狼
三、社區:開發者頭條、掘金(CSDN和博客園內容太雜了,很差篩選)
四、視頻:沒見過講解集合類的視頻,讀者有了解的話能夠推薦給我
五、書籍:沒見過講解集合類的書籍,讀者有了解的話能夠推薦給我
https://www.jianshu.com/p/939...
https://www.cnblogs.com/xuexu...
<section data-role="outer">
文能碼字,武能coding,是我黃小斜,不是黃老邪噢。
推薦閱讀:
</section>
<section data-tools="135編輯器" data-id="94248">
<section>
<section></section>
<section>
<section>
<section data-brushtype="text">喜歡本文的話,就點一下「在看」吧</section>
</section>
</section>
</section>
</section>
</section>
</section>