面經分享：如何破解 Java 集合類面試題

時間 2019-12-08

標籤分享如何破解 java 集合面試欄目 Java 简体版

原文原文鏈接

今日招式：Java集合類面試題

Java集合類絕對是咱們的老朋友了，Java技術江湖裏，誰人不知，誰人不曉，它的使用率很是高，使用難度卻也不大，這也致使了不少人對它不屑一顧，卻不知其中卻暗藏玄機，今天咱們不妨一塊兒來破解一下Java集合類的面試題。面試

面試官經常使用招式：

只見面試官微微一笑，拔出長劍，向你刺來，你趕忙拔劍相迎，幾招事後，你才意識到面試官使的都是虛招，只是試探你而已。算法

1.Java集合框架的基礎接口有哪些？

Collection爲集合層級的根接口。一個集合表明一組對象，這些對象即爲它的元素。Java平臺不提供這個接口任何直接的實現。
Set是一個不能包含重複元素的集合。這個接口對數學集合抽象進行建模，被用來表明集合，就如一副牌。
List是一個有序集合，能夠包含重複元素。你能夠經過它的索引來訪問任何元素。List更像長度動態變換的數組。
Map是一個將key映射到value的對象.一個Map不能包含重複的key：每一個key最多隻能映射一個value。
一些其它的接口有Queue、Dequeue、SortedSet、SortedMap和ListIterator。複製代碼

2.Iterater和ListIterator之間有什麼區別？

（1）咱們可使用Iterator來遍歷Set和List集合，而ListIterator只能遍歷List。數據庫

（2）Iterator只能夠向前遍歷，而LIstIterator能夠雙向遍歷。api

（3）ListIterator從Iterator接口繼承，而後添加了一些額外的功能，好比添加一個元素、替換一個元素、獲取前面或後面元素的索引位置。數組

3.遍歷一個List有哪些不一樣的方式？

List<String> strList = new ArrayList<>();for(String obj : strList){   System.out.println(obj); }
Iterator<String> it = strList.iterator(); while(it.hasNext()){   String obj = it.next();   System.out.println(obj); }複製代碼

使用迭代器更加線程安全，由於它能夠確保，在當前遍歷的集合元素被更改的時候，它會拋出ConcurrentModificationException。緩存

4.在Java中，HashMap是如何工做的？

HashMap在Map.Entry靜態內部類實現中存儲key-value對。HashMap使用哈希算法，在put和get方法中，它使用hashCode()和equals()方法。當咱們經過傳遞key-value對調用put方法的時候，HashMap使用Key hashCode()和哈希算法來找出存儲key-value對的索引。Entry存儲在LinkedList中，因此若是存在entry，它使用equals()方法來檢查傳遞的key是否已經存在，若是存在，它會覆蓋value，若是不存在，它會建立一個新的entry而後保存。當咱們經過傳遞key調用get方法時，它再次使用hashCode()來找到數組中的索引，而後使用equals()方法找出正確的Entry，而後返回它的值。下面的圖片解釋了詳細內容。
其它關於HashMap比較重要的問題是容量、負荷係數和閥值調整。HashMap默認的初始容量是32，負荷係數是0.75。閥值是爲負荷係數乘以容量，不管什麼時候咱們嘗試添加一個entry，若是map的大小比閥值大的時候，HashMap會對map的內容進行從新哈希，且使用更大的容量。容量老是2的冪，因此若是你知道你須要存儲大量的key-value對，好比緩存從數據庫裏面拉取的數據，使用正確的容量和負荷係數對HashMap進行初始化是個不錯的作法。複製代碼

5.hashCode()和equals()方法有何重要性？

HashMap使用Key對象的hashCode()和equals()方法去決定key-value對的索引。當咱們試着從HashMap中獲取值的時候，這些方法也會被用到。若是這些方法沒有被正確地實現，在這種狀況下，兩個不一樣Key也許會產生相同的hashCode()和equals()輸出，HashMap將會認爲它們是相同的，而後覆蓋它們，而非把它們存儲到不一樣的地方。一樣的，全部不容許存儲重複數據的集合類都使用hashCode()和equals()去查找重複，因此正確實現它們很是重要。equals()和hashCode()的實現應該遵循如下規則：複製代碼

（1）若是o1.equals(o2)，那麼o1.hashCode() == o2.hashCode()老是爲true的。安全

（2）若是o1.hashCode() == o2.hashCode()，並不意味着o1.equals(o2)會爲true。性能優化

6.咱們可否使用任何類做爲Map的key？

咱們可使用任何類做爲Map的key，然而在使用它們以前，須要考慮如下幾點：複製代碼

（1）若是類重寫了equals()方法，它也應該重寫hashCode()方法。bash

（2）類的全部實例須要遵循與equals()和hashCode()相關的規則。請參考以前提到的這些規則。數據結構

（3）若是一個類沒有使用equals()，你不該該在hashCode()中使用它。

（4）用戶自定義key類的最佳實踐是使之爲不可變的，這樣，hashCode()值能夠被緩存起來，擁有更好的性能。不可變的類也能夠確保hashCode()和equals()在將來不會改變，這樣就會解決與可變相關的問題了。

好比，我有一個類MyKey，在HashMap中使用它。
//傳遞給MyKey的name參數被用於equals()和hashCode()中 MyKey key = new MyKey('Pankaj'); //assume hashCode=1234 myHashMap.put(key, 'Value'); // 如下的代碼會改變key的hashCode()和equals()值 key.setName('Amit'); //assume new hashCode=7890 //下面會返回null，由於HashMap會嘗試查找存儲一樣索引的key，而key已被改變了，匹配失敗，返回null myHashMap.get(new MyKey('Pankaj'));
那就是爲什麼String和Integer被做爲HashMap的key大量使用。複製代碼

7.HashMap和HashTable有何不一樣？

（1）HashMap容許key和value爲null，而HashTable不容許。

（2）HashTable是同步的，而HashMap不是。因此HashMap適合單線程環境，HashTable適合多線程環境。

（3）在Java1.4中引入了LinkedHashMap，HashMap的一個子類，假如你想要遍歷順序，你很容易從HashMap轉向LinkedHashMap，可是HashTable不是這樣的，它的順序是不可預知的。

（4）HashMap提供對key的Set進行遍歷，所以它是fail-fast的，但HashTable提供對key的Enumeration進行遍歷，它不支持fail-fast。

（5）HashTable被認爲是個遺留的類，若是你尋求在迭代的時候修改Map，你應該使用CocurrentHashMap。

8.ArrayList和Vector有何異同點？

ArrayList和Vector在不少時候都很相似。複製代碼

（1）二者都是基於索引的，內部由一個數組支持。

（2）二者維護插入的順序，咱們能夠根據插入順序來獲取元素。

（3）ArrayList和Vector的迭代器實現都是fail-fast的。

（4）ArrayList和Vector二者容許null值，也可使用索引值對元素進行隨機訪問。

如下是ArrayList和Vector的不一樣點。複製代碼

（1）Vector是同步的，而ArrayList不是。然而，若是你尋求在迭代的時候對列表進行改變，你應該使用CopyOnWriteArrayList。

（2）ArrayList比Vector快，它由於有同步，不會過載。

（3）ArrayList更加通用，由於咱們可使用Collections工具類輕易地獲取同步列表和只讀列表。

9.Array和ArrayList有何區別？何時更適合用Array？

Array能夠容納基本類型和對象，而ArrayList只能容納對象。
Array是指定大小的，而ArrayList大小是固定的。
Array沒有提供ArrayList那麼多功能，好比addAll、removeAll和iterator等。儘管ArrayList明顯是更好的選擇，但也有些時候Array比較好用。複製代碼

（1）若是列表的大小已經指定，大部分狀況下是存儲和遍歷它們。

（2）對於遍歷基本數據類型，儘管Collections使用自動裝箱來減輕編碼任務，在指定大小的基本類型的列表上工做也會變得很慢。

（3）若是你要使用多維數組，使用[][]比List>更容易。

10.ArrayList和LinkedList有何區別？

ArrayList和LinkedList二者都實現了List接口，可是它們之間有些不一樣。複製代碼

（1）ArrayList是由Array所支持的基於一個索引的數據結構，因此它提供對元素的隨機訪問，複雜度爲O(1)，但LinkedList存儲一系列的節點數據，每一個節點都與前一個和下一個節點相鏈接。因此，儘管有使用索引獲取元素的方法，內部實現是從起始點開始遍歷，遍歷到索引的節點而後返回元素，時間複雜度爲O(n)，比ArrayList要慢。

（2）與ArrayList相比，在LinkedList中插入、添加和刪除一個元素會更快，由於在一個元素被插入到中間的時候，不會涉及改變數組的大小，或更新索引。

（3）LinkedList比ArrayList消耗更多的內存，由於LinkedList中的每一個節點存儲了先後節點的引用。

11.哪些集合類是線程安全的？

Vector、HashTable、Properties和Stack是同步類，因此它們是線程安全的，能夠在多線程環境下使用。Java1.5併發API包括一些集合類，容許迭代時修改，由於它們都工做在集合的克隆上，因此它們在多線程環境中是安全的。複製代碼

12.Collections類是什麼？

Java.util.Collections是一個工具類僅包含靜態方法，它們操做或返回集合。它包含操做集合的多態算法，返回一個由指定集合支持的新集合和其它一些內容。這個類包含集合框架算法的方法，好比折半搜索、排序、混編和逆序等。複製代碼

13.Comparable和Comparator接口有何區別？

Comparable和Comparator接口被用來對對象集合或者數組進行排序。Comparable接口被用來提供對象的天然排序，咱們可使用它來提供基於單個邏輯的排序。
Comparator接口被用來提供不一樣的排序算法，咱們能夠選擇須要使用的Comparator來對給定的對象集合進行排序。複製代碼

14.咱們如何對一組對象進行排序？

若是咱們須要對一個對象數組進行排序，咱們可使用Arrays.sort()方法。若是咱們須要排序一個對象列表，咱們可使用Collection.sort()方法。兩個類都有用於天然排序（使用Comparable）或基於標準的排序（使用Comparator）的重載方法sort()。Collections內部使用數組排序方法，全部它們二者都有相同的性能，只是Collections須要花時間將列表轉換爲數組。複製代碼

高手過招

面試官見你應對自如，知道你也不是等閒之輩，因而眼神也變得專一起來，因而大家雙雙躍起，在空中展開廝鬥，雖然面試官每一招都很是到位，可是你依然能夠與之抗衡。

一、HashMap爲何不直接使用hashCode()處理後的哈希值直接做爲table的下標？

HashMap本身實現了本身的hash()方法，經過兩次擾動使得它本身的哈希值高低位自行進行異或運算，下降哈希碰撞機率也使得數據分佈更平均；

在保證數組長度爲2的冪次方的時候，使用hash()運算以後的值與運算（&）（數組長度 - 1）來獲取數組下標的方式進行存儲，這樣一來是比取餘操做更加有效率，二來也是由於只有當數組長度爲2的冪次方時，h&(length-1)纔等價於h%length，三來解決了「哈希值與數組大小範圍不匹配」的問題；

二、爲何數組長度要保證爲2的冪次方呢？

只有當數組長度爲2的冪次方時，h&(length-1)纔等價於h%length，即實現了key的定位，2的冪次方也能夠減小衝突次數，提升HashMap的查詢效率；

若是 length 爲 2 的次冪則 length-1 轉化爲二進制一定是 11111……的形式，在於 h 的二進制與操做效率會很是的快，並且空間不浪費；若是 length 不是 2 的次冪，好比 length 爲 15，則 length - 1 爲 14，對應的二進制爲 1110，在於 h 與操做，最後一位都爲 0 ，而 0001，0011，0101，1001，1011，0111，1101 這幾個位置永遠都不能存放元素了，空間浪費至關大，更糟的是這種狀況中，數組可使用的位置比數組長度小了不少，這意味着進一步增長了碰撞的概率，減慢了查詢的效率！這樣就會形成空間的浪費。

三、HashMap的put方法的具體流程？

四、ConcurrentHashMap的具體實現知道嗎？

答：在JDK1.7中，ConcurrentHashMap採用Segment + HashEntry的方式進行實現，結構以下：

該類包含兩個靜態內部類 HashEntry 和 Segment ；前者用來封裝映射表的鍵值對，後者用來充當鎖的角色； Segment 是一種可重入的鎖 ReentrantLock，每一個 Segment 守護一個HashEntry 數組裏得元素，當對 HashEntry 數組的數據進行修改時，必須首先得到對應的 Segment 鎖。

在JDK1.8中，放棄了Segment臃腫的設計，取而代之的是採用Node + CAS + Synchronized來保證併發安全進行實現，結構以下：

插入元素過程（建議去看看源碼）：

若是相應位置的Node尚未初始化，則調用CAS插入相應的數據；

else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {    if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))        break;                   // no lock when adding to empty bin}複製代碼

若是相應位置的Node不爲空，且當前該節點不處於移動狀態，則對該節點加synchronized鎖，若是該節點的hash不小於0，則遍歷鏈表更新節點或插入新節點；

if (fh >= 0) {    binCount = 1;    for (Node<K,V> e = f;; ++binCount) {        K ek;        if (e.hash == hash &&            ((ek = e.key) == key ||             (ek != null && key.equals(ek)))) {            oldVal = e.val;            if (!onlyIfAbsent)                e.val = value;            break;        }        Node<K,V> pred = e;        if ((e = e.next) == null) {            pred.next = new Node<K,V>(hash, key, value, null);            break;        }    }}複製代碼

若是該節點是TreeBin類型的節點，說明是紅黑樹結構，則經過putTreeVal方法往紅黑樹中插入節點；若是binCount不爲0，說明put操做對數據產生了影響，若是當前鏈表的個數達到8個，則經過treeifyBin方法轉化爲紅黑樹，若是oldVal不爲空，說明是一次更新操做，沒有對元素個數產生影響，則直接返回舊值；若是插入的是一個新節點，則執行addCount()方法嘗試更新元素個數baseCount；

五、HashMap的擴容操做是怎麼實現的？

答：經過分析源碼咱們知道了HashMap經過resize()方法進行擴容或者初始化的操做，下面是對源碼進行的一些簡單分析：

/** * 該函數有2中使用狀況：1.初始化哈希表；2.當前數組容量太小，須要擴容 */final Node<K,V>[] resize() {    Node<K,V>[] oldTab = table;// 擴容前的數組（當前數組）    int oldCap = (oldTab == null) ? 0 : oldTab.length;// 擴容前的數組容量（數組長度）    int oldThr = threshold;// 擴容前數組的閾值    int newCap, newThr = 0;
    if (oldCap > 0) {        // 針對狀況2：若擴容前的數組容量超過最大值，則再也不擴容        if (oldCap >= MAXIMUM_CAPACITY) {            threshold = Integer.MAX_VALUE;            return oldTab;        }        // 針對狀況2：若沒有超過最大值，就擴容爲原來的2倍（左移1位）        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&                oldCap >= DEFAULT_INITIAL_CAPACITY)            newThr = oldThr << 1; // double threshold    }
    // 針對狀況1：初始化哈希表（採用指定或者使用默認值的方式）    else if (oldThr > 0) // initial capacity was placed in threshold        newCap = oldThr;    else {               // zero initial threshold signifies using defaults        newCap = DEFAULT_INITIAL_CAPACITY;        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);    }
    // 計算新的resize上限    if (newThr == 0) {        float ft = (float)newCap * loadFactor;        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?                (int)ft : Integer.MAX_VALUE);    }    threshold = newThr;    @SuppressWarnings({"rawtypes","unchecked"})    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];    table = newTab;    if (oldTab != null) {        // 把每個bucket都移動到新的bucket中去        for (int j = 0; j < oldCap; ++j) {            Node<K,V> e;            if ((e = oldTab[j]) != null) {                oldTab[j] = null;                if (e.next == null)                    newTab[e.hash & (newCap - 1)] = e;                else if (e instanceof TreeNode)                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);                else { // preserve order                    Node<K,V> loHead = null, loTail = null;                    Node<K,V> hiHead = null, hiTail = null;                    Node<K,V> next;                    do {                        next = e.next;                        if ((e.hash & oldCap) == 0) {                            if (loTail == null)                                loHead = e;                            else                                loTail.next = e;                            loTail = e;                        }                        else {                            if (hiTail == null)                                hiHead = e;                            else                                hiTail.next = e;                            hiTail = e;                        }                    } while ((e = next) != null);                    if (loTail != null) {                        loTail.next = null;                        newTab[j] = loHead;                    }                    if (hiTail != null) {                        hiTail.next = null;                        newTab[j + oldCap] = hiHead;                    }                }            }        }    }    return newTab;}複製代碼

武學根基

雖然剛剛的打鬥確實激烈，招式也十分好看，可是背後隱藏着的武學基礎倒是有共同之處的。在本篇裏指的即是Java集合類的基礎知識點。

其實Java集合類的面試題遠不止如此，面試官可能會問你每一個實現細節，因此即便你見過了全部的面試題型，而且都緊緊記住，那又有什麼用呢，不能理解其原理，光會表面招式，最後就會被輕易擊敗。

下面咱們不妨就見招拆招，說Java集合類裏的那些基礎、門道以及正確掌握這部份內容的方法。

初來乍到

第一次接觸集合類，遇到的是ArrayList，當時連<>表明泛型都不知道，讓我new一個ArrayList對象都不利索，直到開始瞭解到它的api，才感受其實這個玩意也並非很複雜呀，不就是put，get等一些看起來就很簡單的方法嗎。

小試牛刀

抱着這樣的想法，我開始在一些項目和練習題中使用ArrayList，用法確實不難，正常狀況咱們只須要使用put，get，remove等方法，不過有時候也會遇到一些問題，好比你在用for循環刪除ArrayList的元素時，就會發現，若是你按照下標來刪除，是會報錯的，這就讓我很頭大了，不理解其實現原理，光會用api，看來仍是不行啊。

漸入佳境

我一直認爲，面試是學習的一大動力，當時爲了面試大廠，確實也看了不少面試題，集合類是跨不過去的一道坎，而且須要深刻到源碼裏去理解，好比hashmap的底層原理，絕對是大場面試中最愛考的一道題目，因而我跟着幾位大牛的博客（後面有推薦）複習了一整遍hashmap的實現原理，理解了80%左右的內容，這纔可以應付大廠的面試題。

學有所成

當你理解了整個hashmap的實現原理以後，你就會發現大部分面試題都難不倒你了。我本身作了一個總結，每當面試官問我「JDK裏的hashmap是怎麼實現的」我基本上都會用如下內容作回答。

固然，這僅供參考，切不可死記硬背，畢竟這只是我本身理解後整理出來的東西。

hashmap是數組和鏈表的組合結構，數組是一個Entry數組，entry是k-V鍵值對類型，因此一個entry數組存着很entry節點，一個entry的位置經過key的hashcode方法，再進行hash（移位等操做），最後與表長-1進行相與操做，其實就是取hash值到的後n - 1位，n表明表長是2的n次方。

hashmap的默認負載因子是0.75，閾值是16 * 0.75 = 12；初始長度爲16；

hashmap的增刪改查方式比較簡單，都是遍歷，替換。有一點要注意的是key相等時，替換元素，不相等時連成鏈表。

除此以外，1.8jdk改進了hashmap，當鏈表上的元素個數超過8個時自動轉化成紅黑樹，節點變成樹節點，以提升搜索效率和插入效率到logn。

還有一點值得一提的是，hashmap的擴容操做，因爲hashmap非線程安全，擴容時若是多線程併發進行操做，則可能有兩個線程分別操做新表和舊錶，致使節點成環，查詢時會造成死鎖。chm避免了這個問題。

另外，擴容時會將舊錶元素移到新表，原來的版本移動時會有rehash操做，每一個節點都要rehash，很是不方便，而1.8改爲另外一種方式，對於同一個index下的鏈表元素，因爲一個元素的hash值在擴容後只有兩種狀況，要麼是hash值不變，要麼是hash值變爲原來值+2^n次方，這是由於表長翻倍，因此hash值取後n位，第一位要麼是0要麼是1，因此hash值也只有兩種狀況。這兩種狀況的元素分別加到兩個不一樣的鏈表。這兩個鏈表也只須要分別放到新表的兩個位置便可，是否是很酷。

最後有一個比較冷門的知識點，hashmap1.7版本鏈表使用的是節點的頭插法，擴容時轉移鏈表仍然使用頭插法，這樣的結果就是擴容後鏈表會倒置，而hashmap.1.8在插入時使用尾插法，擴容時使用頭插法，這樣能夠保證順序不變。

讀者福利

給你們推薦一個架構技術交流羣：714827309 ，裏面會分享一些資深架構師錄製的視頻錄像：有Spring，MyBatis，Netty源碼分析，高併發、高性能、分佈式、微服務架構的原理，JVM性能優化這些成爲架構師必備的知識體系。還能領取免費的學習資源，相信對於已經工做和遇到技術瓶頸的碼友，在這個羣裏會有你須要的內容。點擊連接加入羣聊【JAVA高級架構技術交流】：jq.qq.com/?_wv=1027&a…