簡潔方便的集合處理——Java 8 stream流

時間 2019-11-12

原文原文鏈接

背景

java 8已經發行好幾年了，前段時間java 12也已經問世，但平時的工做中，不少項目的環境還停留在java1.7中。並且java8的不少新特性都是革命性的，好比各類集合的優化、lambda表達式等，因此咱們仍是要去了解java8的魅力。java

今天咱們來學習java8的Stream，並不須要理論基礎，直接能夠上手去用。mysql

我接觸stream的緣由，是我要搞一個用戶收入消費的數據分析。起初的統計篩選分組都是打算用sql語言直接從mysql裏獲得結果來展示的。但在操做中咱們發現這樣頻繁地訪問數據庫，性能會受到很大的影響，分析速度會很慢。因此咱們但願能經過訪問一次數據庫就拿到全部數據，而後放到內存中去進行數據分析統計過濾。sql

接着，我看了stream的API，發現這就是我想要的。數據庫

1、Stream理解

在java中咱們稱Stream爲『流』，咱們常常會用流去對集合進行一些流水線的操做。stream就像工廠同樣，只須要把集合、命令還有一些參數灌輸到流水線中去，就能夠加工成得出想要的結果。這樣的流水線能大大簡潔代碼，減小操做。數組

2、Stream流程

原集合 —> 流  —> 各類操做(過濾、分組、統計) —> 終端操做

Stream流的操做流程通常都是這樣的，先將集合轉爲流，而後通過各類操做，好比過濾、篩選、分組、計算。最後的終端操做，就是轉化成咱們想要的數據，這個數據的形式通常仍是集合，有時也會按照需求輸出count計數。下文會一一舉例。數據結構

3、API功能舉例

首先，定義一個用戶對象，包含姓名、年齡、性別和籍貫四個成員變量：函數

import lombok.AllArgsConstructor;
import lombok.Builder;
import lombok.Data;
import lombok.NoArgsConstructor;
import lombok.extern.log4j.Log4j;

@Data
@NoArgsConstructor
@AllArgsConstructor
@Log4j
@Builder
public class User {
    //姓名
    private String name;
    //年齡
    private Integer age;
    //性別
    private Integer sex;
    //所在省市
    private String address;
}

這裏用lombok簡化了實體類的代碼。性能

而後建立須要的集合數據，也就是源數據：學習

//1.構建咱們的list
List<User> list= Arrays.asList(
        new User("鋼鐵俠",40,0,"華盛頓"),
        new User("蜘蛛俠",20,0,"華盛頓"),
        new User("趙麗穎",30,1,"湖北武漢市"),
        new User("詹姆斯",35,0,"洛杉磯"),
        new User("李世民",60,0,"山西省太原市"),
        new User("蔡徐坤",20,1,"陝西西安市"),
        new User("葫蘆娃的爺爺",70,0,"山西省太原市")
);

3.1 過濾

1）建立流 stream() / parallelStream()

stream() : 串行流
parallelStream（）: 並行流

2）filter 過濾(T-> boolean)

好比要過濾年齡在40歲以上的用戶，就能夠這樣寫：優化

List<User> filterList = list.stream().filter(user -> user.getAge() >= 40)
        .collect(toList());

filter裏面，->箭頭後面跟着的是一個boolean值，能夠寫任何的過濾條件，就至關於sql中where後面的東西，換句話說，能用sql實現的功能這裏均可以實現

打印結果：

3）distinct 去重

和sql中的distinct關鍵字很類似。爲了看到效果，此處在原集合中加入一個重複的人，就選擇鋼鐵俠吧，復聯4鋼鐵俠不幸遇害，你們仍是比較傷心的。

List<User> list= Arrays.asList(
        new User("鋼鐵俠",40,0,"華盛頓"),
        new User("鋼鐵俠",40,0,"華盛頓"),
        new User("蜘蛛俠",20,0,"華盛頓"),
        new User("趙麗穎",30,1,"湖北武漢市"),
        new User("詹姆斯",35,0,"洛杉磯"),
        new User("李世民",60,0,"山西省太原市"),
        new User("蔡徐坤」,18,1,"陝西西安市"),
        new User("葫蘆娃的爺爺",70,0,"山西省太原市")
);

//distinct 去重
List<User> distinctList = filterList.stream().distinct()
        .collect(toList());

打印結果：

4）sorted排序

若是流中的元素的類實現了 Comparable 接口，即有本身的排序規則，那麼能夠直接調用 sorted() 方法對元素進行排序，如：

Comparator.comparingInt

反之, 須要調用 sorted((T, T) -> int) 實現 Comparator 接口。

//sorted()
List<User> sortedList = distinctList.stream().sorted(Comparator.comparingInt(User::getAge))
        .collect(toList());

打印結果：

結果按照年齡從小到大進行排序。

5）limit（）返回前n個元素

若是想知道這裏面年齡最小的是誰，可做以下操做：

//limit 返回前n個元素
List<User> limitList = sortedList.stream().limit(1)
        .collect(toList());

6）skip()

與limit偏偏相反，skip的意思是跳過，也就是去除前n個元素。

打印結果：

果真，前兩我的都被去除了，只剩下最老的葫蘆娃爺爺。

3.2 映射

1）map(T->R)

map是將T類型的數據轉爲R類型的數據，好比咱們想要設置一個新的list，存儲用戶全部的城市信息。

//map(T->R)
List<String> cityList = list.stream().map(User::getAddress).distinct().collect(toList());

打印結果：

2）flatMap(T -> Stream<R>)

將流中的每個元素 T 映射爲一個流，再把每個流鏈接成爲一個流。

//flatMap(T -> Stream<R>)
List<String> flatList = new ArrayList<>();
flatList.add("唱,跳");
flatList.add("rape,籃球,music");
flatList = flatList.stream().map(s -> s.split(",")).flatMap(Arrays::stream).collect(toList());

打印結果：

這裏原集合中的數據由逗號分割，使用split進行拆分後，獲得的是Stream<String[]>，字符串數組組成的流，要使用flatMap的

Arrays::stream

將Stream<String[]>轉爲Stream<String>,而後把流相鏈接，組成了完整的唱、跳、rap、籃球和music。

3.3 查找

1）allMatch（T->boolean）

檢測是否所有知足參數行爲，假如這些用戶是網吧上網的用戶名單，那就須要檢查是否是每一個人都年滿18週歲了。

boolean isAdult = list.stream().allMatch(user -> user.getAge() >= 18);

打印結果：

true

2）anyMatch（T->boolean）

檢測是否有任意元素知足給定的條件，好比，想知道同窗名單裏是否有女生。

//anyMatch(T -> boolean） 是否有任意一個元素知足給定的條件
boolean isGirl = list.stream().anyMatch(user -> user.getSex() == 1);

打印結果：

true

說明集合中有女生存在。

3）noneMatch(T -> boolean)

流中是否有元素匹配給定的 T -> boolean 條件。

好比檢測有沒有來自巴黎的用戶。

boolean isLSJ = list.stream().noneMatch(user -> user.getAddress().contains("巴黎"));

打印結果：

true

打印true說明沒有巴黎的用戶。

4）findFirst( ):找到第一個元素

Optional<User> fristUser  = list.stream().findFirst();

打印結果：

User(name=鋼鐵俠, age=40, sex=0, address=華盛頓)

5）findAny():找到任意一個元素

Optional<User> anyUser  = list.stream().findAny();

打印結果：

User(name=鋼鐵俠, age=40, sex=0, address=華盛頓)

這裏咱們發現findAny返回的也老是第一個元素，那麼爲何還要進行區分呢？由於在並行流 parallelStream() 中找到的確實是任意一個元素。

Optional<User> anyParallelUser  = list.parallelStream().findAny();

打印結果 :

Optional[User(name=李世民, age=60, sex=0, address=山西省太原市)]

3.4 概括計算

1）求用戶的總人數

long count = list.stream().collect(Collectors.counting());

咱們能夠簡寫爲：

long count = list.stream().count();

運行結果：

2）獲得某一屬性的最大最小值

// 求最大年齡
Optional<User> max = list.stream().collect(Collectors.maxBy(
Comparator.comparing(User::getAge)));

// 求最小年齡
Optional<User> min = list.stream().collect(Collectors.minBy(
Comparator.comparing(User::getAge)));

運行結果：

3）求年齡總和是多少

// 求年齡總和
int totalAge = list.stream().collect(Collectors.summingInt(User::getAge));

運行結果：

咱們常常會用BigDecimal來記錄金錢，假設想獲得BigDecimal的總和：

// 得到列表對象金額， 使用reduce聚合函數,實現累加器
BigDecimal sum = myList.stream() .map(User::getMoney)
.reduce(BigDecimal.ZERO,BigDecimal::add);

4）求年齡平均值

//求年齡平均值
double avgAge = list.stream().collect(
Collectors.averagingInt(User::getAge));

運行結果:

39.125

5）一次性獲得元素的個數、總和、最大值、最小值

IntSummaryStatistics statistics = list.stream().collect(
Collectors.summarizingInt(User::getAge));

運行結果：

6）字符串拼接

要將用戶的姓名連成一個字符串並用逗號分割。

String names = list.stream().map(User::getName)
.collect(Collectors.joining(", "));

運行結果：

鋼鐵俠, 鋼鐵俠, 蜘蛛俠, 趙麗穎, 詹姆斯, 李世民, 蔡徐坤, 葫蘆娃的爺爺

3.5 分組

在數據庫操做中，咱們常常經過GROUP BY關鍵字對查詢到的數據進行分組，java8的流式處理也提供了分組的功能。使用Collectors.groupingBy來進行分組。

1）能夠根據用戶所在城市進行分組

Map<String, List<User>> cityMap = list.stream()
.collect(Collectors.groupingBy(User::getAddress));

結果是一個map，key爲不重複的城市名，value爲屬於該城市的用戶列表。已經實現了分組。

2）二級分組，先根據城市分組再根據性別分組

Map<String, Map<Integer, List<User>>> group = list.stream().collect(
        Collectors.groupingBy(User::getAddress, // 一級分組，按所在地區
                Collectors.groupingBy(User::getSex))); // 二級分組，按性別

運行結果：

3）若是僅僅想統計各城市的用戶個數是多少，並不須要對應的list

按城市分組並統計人數：

Map<String, Long> cityCountMap = list.stream()
.collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));

運行結果：

4）固然，也能夠先進行過濾再分組並統計人數

Map<String,Long> map = list.stream().filter(user -> user.getAge() <= 30)
        .collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));

運行結果：

5）partitioningBy 分區

分區與分組的區別在於，分區是按照 true 和 false 來分的，所以partitioningBy 接受的參數的 lambda 也是 T -> boolean

//根據年齡是否小於等於30來分區
Map<Boolean, List<User>> part = list.stream()
        .collect(partitioningBy(user -> user.getAge() <= 30));

運行結果：

總結

到目前爲止，stream的功能咱們已經用了不少了，感受有點眼花繚亂卻無所不能，stream能作的事情遠遠不止這些。

咱們能夠多學習使用stream，把原來複雜的sql查詢，一遍又一遍地for循環的複雜代碼重構，讓代碼更簡潔易懂，可讀性強。

拓展閱讀：Redis專題（1）：構建知識圖譜

Redis專題(2)：Redis數據結構底層探祕

做者：楊亨

來源：宜信技術學院

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

簡潔方便的集合處理——Java 8 stream流

背景

1、Stream理解

2、Stream流程

3、API功能舉例

3.1 過濾

1）建立流 stream() / parallelStream()

2）filter 過濾(T-> boolean)

3）distinct 去重

4）sorted排序

5）limit（） 返回前n個元素

6）skip()

3.2 映射

1）map(T->R)

2）flatMap(T -> Stream<R>)

3.3 查找

1）allMatch（T->boolean）

2）anyMatch（T->boolean）

3）noneMatch(T -> boolean)

4）findFirst( ):找到第一個元素

5）findAny():找到任意一個元素

3.4 概括計算

1）求用戶的總人數

2）獲得某一屬性的最大最小值

3）求年齡總和是多少

4）求年齡平均值

5）一次性獲得元素的個數、總和、最大值、最小值

6）字符串拼接

3.5 分組

1）能夠根據用戶所在城市進行分組

2）二級分組，先根據城市分組再根據性別分組

3）若是僅僅想統計各城市的用戶個數是多少，並不須要對應的list

4）固然，也能夠先進行過濾再分組並統計人數

5）partitioningBy 分區

總結

5）limit（）返回前n個元素