高效遍歷Java容器

經過本文,你能夠更深刻的學習 Java 語言中 forEach 語法的知識,以及它和 C 語言形式的 for 循環、 Steam API 的對比。java

簡介

Java 程序員常常使用容器,好比 ArrayList 和 HashSet。Java 8 中的 lambda 語法和 steaming API 可讓咱們更方便的使用容器。大部分狀況下,咱們僅僅處理幾千個元素,也不會去考慮性能問題。可是,在一些極端場景下,若是咱們須要遍歷上百萬個元素,性能問題就凸顯出來了。程序員

本文將採用 JMH 計算每塊代碼的運行時間。編程

forEach vs. C Style vs. Stream API

遍歷是一個基本的功能。全部編程語言都提供了簡單的語法,讓程序員去遍歷容器。Steam API 以一種很是直接的形式來遍歷容器。架構

1編程語言

2分佈式

3oop

4源碼分析

5性能

6學習

7

8

9

10

11

12

13

14

public List<Integer> streamSingleThread(BenchMarkState state){

    List<Integer> result = new ArrayList<>(state.testData.size());

    state.testData.stream().forEach(item -> {

        result.add(item);

    });

    return result;

}

public List<Integer> streamMultiThread(BenchMarkState state){

    List<Integer> result = new ArrayList<>(state.testData.size());

    state.testData.stream().parallel().forEach(item -> {

        result.add(item);

    });

    return result;

}

forEach 循環也很簡單:

1

2

3

4

5

6

7

public List<Integer> forEach(BenchMarkState state){

  List<Integer> result = new ArrayList<>(state.testData.size());

  for(Integer item : state.testData){

    result.add(item);

  }

  return result;

}

C 語言形式的 for 循環囉嗦一些,不過依然很緊湊:

1

2

3

4

5

6

7

8

public List<Integer> forCStyle(BenchMarkState state){

  int size = state.testData.size();

  List<Integer> result = new ArrayList<>(size);

  for(int j = 0; j < size; j ++){

    result.add(state.testData.get(j));

  }

  return result;

}

如下是性能報告:

1

2

3

4

5

Benchmark                               Mode  Cnt   Score   Error  Units

TestLoopPerformance.forCStyle           avgt  200  18.068 ± 0.074  ms/op

TestLoopPerformance.forEach             avgt  200  30.566 ± 0.165  ms/op

TestLoopPerformance.streamMultiThread   avgt  200  79.433 ± 0.747  ms/op

TestLoopPerformance.streamSingleThread  avgt  200  37.779 ± 0.485  ms/op

使用 C 語言形式的 for 循環,JVM 每次僅僅增長一個數字,而後直接從內存裏讀出數據。這使得它很是迅速。可是 forEach 就大不同,JVM 須要把 forEach 轉換成一個 iterator,而後每一個元素都調用一次 hasNext() 方法。這就是 forEach 比 C 語言的形式慢一些的緣由。

哪個是遍歷 Set 最高效的方法呢?

咱們先定義測試數據集:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

@State(Scope.Benchmark)

public static class BenchMarkState {

    @Setup(Level.Trial)

    public void doSetup() {

        for(int i = 0; i < 500000; i++){

            testData.add(Integer.valueOf(i));

        }

    }

    @TearDown(Level.Trial)

    public void doTearDown() {

        testData = new HashSet<>(500000);

    }

    public Set<Integer> testData = new HashSet<>(500000);

}

Java 中的 Set 也支持 Steam API 和 forEach 循環。參考以前的測試,若是咱們把 Set 轉換成 ArrayList,而後遍歷 ArrayList,或許性能會好一些?

1

2

3

4

5

6

7

8

9

public List<Integer> forCStyle(BenchMarkState state){

    int size = state.testData.size();

    List<Integer> result = new ArrayList<>(size);

    Integer[] temp = (Integer[]) state.testData.toArray(new Integer[size]);

    for(int j = 0; j < size; j ++){

        result.add(temp[j]);

    }

    return result;

}

若是把 iterator 和 C 語言形式結合起來呢?

1

2

3

4

5

6

7

8

9

public List<Integer> forCStyleWithIteration(BenchMarkState state){

    int size = state.testData.size();

    List<Integer> result = new ArrayList<>(size);

    Iterator<Integer> iteration = state.testData.iterator();

        for(int j = 0; j < size; j ++){

            result.add(iteration.next());

        }

    return result;

}

或者,簡單的遍歷怎麼樣?

1

2

3

4

5

6

7

public List<Integer> forEach(BenchMarkState state){

    List<Integer> result = new ArrayList<>(state.testData.size());

    for(Integer item : state.testData) {

        result.add(item);

    }

    return result;

}

這個主意不錯,不過它的效率也不高,由於初始化一個新的 ArrayList 一樣須要消耗資源。

1

2

3

4

Benchmark                                   Mode  Cnt  Score   Error  Units

TestLoopPerformance.forCStyle               avgt  200  6.013 ± 0.108  ms/op

TestLoopPerformance.forCStyleWithIteration  avgt  200  4.281 ± 0.049  ms/op

TestLoopPerformance.forEach                 avgt  200  4.498 ± 0.026  ms/op

HashMap (使用 HashMap<E,Object> 的 HashSet) 不是爲遍歷全部元素設計的。遍歷一個 HashMap 最快的方法是把 Iterator 和 C 語言形式結合起來,這樣 JVM 就不會去調用 hasNext()。

結論

Foreach 和 Steam API 用來處理集合是很方便的。你能夠更快的寫代碼。不過,若是你的系統很穩定,性能是一個主要的考量,你應該考慮一下重寫你的循環。

歡迎學Java和大數據的朋友們加入java架構交流: 855835163
羣內提供免費的架構資料還有:Java工程化、高性能及分佈式、高性能、深刻淺出。高架構。性能調優、Spring,MyBatis,Netty源碼分析和大數據等多個知識點高級進階乾貨的免費直播講解  能夠進來一塊兒學習交流哦

加羣直通車:https://jq.qq.com/?_wv=1027&k=5dPqXGI

課堂直通車:https://ke.qq.com/course/260263?flowToken=1007014

相關文章
相關標籤/搜索