簡潔方便的集合處理——Java 8 stream流

背景

java 8已經發行好幾年了,前段時間java 12也已經問世,但平時的工做中,不少項目的環境還停留在java1.7中。並且java8的不少新特性都是革命性的,好比各類集合的優化、lambda表達式等,因此咱們仍是要去了解java8的魅力。java

今天咱們來學習java8的Stream,並不須要理論基礎,直接能夠上手去用。mysql

我接觸stream的緣由,是我要搞一個用戶收入消費的數據分析。起初的統計篩選分組都是打算用sql語言直接從mysql裏獲得結果來展示的。但在操做中咱們發現這樣頻繁地訪問數據庫,性能會受到很大的影響,分析速度會很慢。因此咱們但願能經過訪問一次數據庫就拿到全部數據,而後放到內存中去進行數據分析統計過濾。sql

接着,我看了stream的API,發現這就是我想要的。數據庫

1、Stream理解

在java中咱們稱Stream爲『』,咱們常常會用流去對集合進行一些流水線的操做。stream就像工廠同樣,只須要把集合、命令還有一些參數灌輸到流水線中去,就能夠加工成得出想要的結果。這樣的流水線能大大簡潔代碼,減小操做。數組

2、Stream流程

原集合 —> 流  —> 各類操做(過濾、分組、統計) —> 終端操做

Stream流的操做流程通常都是這樣的,先將集合轉爲流,而後通過各類操做,好比過濾、篩選、分組、計算。最後的終端操做,就是轉化成咱們想要的數據,這個數據的形式通常仍是集合,有時也會按照需求輸出count計數。下文會一一舉例。數據結構

在這裏插入圖片描述

3、API功能舉例

首先,定義一個用戶對象,包含姓名、年齡、性別和籍貫四個成員變量:函數

import lombok.AllArgsConstructor;
import lombok.Builder;
import lombok.Data;
import lombok.NoArgsConstructor;
import lombok.extern.log4j.Log4j;

@Data
@NoArgsConstructor
@AllArgsConstructor
@Log4j
@Builder
public class User {
    //姓名
    private String name;
    //年齡
    private Integer age;
    //性別
    private Integer sex;
    //所在省市
    private String address;
}

這裏用lombok簡化了實體類的代碼。性能

而後建立須要的集合數據,也就是源數據:學習

//1.構建咱們的list
List<User> list= Arrays.asList(
        new User("鋼鐵俠",40,0,"華盛頓"),
        new User("蜘蛛俠",20,0,"華盛頓"),
        new User("趙麗穎",30,1,"湖北武漢市"),
        new User("詹姆斯",35,0,"洛杉磯"),
        new User("李世民",60,0,"山西省太原市"),
        new User("蔡徐坤",20,1,"陝西西安市"),
        new User("葫蘆娃的爺爺",70,0,"山西省太原市")
);

3.1 過濾

1)建立流 stream() / parallelStream()

  • stream() : 串行流
  • parallelStream(): 並行流

2)filter 過濾(T-> boolean)

好比要過濾年齡在40歲以上的用戶,就能夠這樣寫:優化

List<User> filterList = list.stream().filter(user -> user.getAge() >= 40)
        .collect(toList());

filter裏面,->箭頭後面跟着的是一個boolean值,能夠寫任何的過濾條件,就至關於sql中where後面的東西,換句話說,能用sql實現的功能這裏均可以實現

打印結果:

在這裏插入圖片描述

3)distinct 去重

和sql中的distinct關鍵字很類似。爲了看到效果,此處在原集合中加入一個重複的人,就選擇鋼鐵俠吧,復聯4鋼鐵俠不幸遇害,你們仍是比較傷心的。

List<User> list= Arrays.asList(
        new User("鋼鐵俠",40,0,"華盛頓"),
        new User("鋼鐵俠",40,0,"華盛頓"),
        new User("蜘蛛俠",20,0,"華盛頓"),
        new User("趙麗穎",30,1,"湖北武漢市"),
        new User("詹姆斯",35,0,"洛杉磯"),
        new User("李世民",60,0,"山西省太原市"),
        new User("蔡徐坤」,18,1,"陝西西安市"),
        new User("葫蘆娃的爺爺",70,0,"山西省太原市")
);
//distinct 去重
List<User> distinctList = filterList.stream().distinct()
        .collect(toList());

打印結果:

在這裏插入圖片描述

4)sorted排序

若是流中的元素的類實現了 Comparable 接口,即有本身的排序規則,那麼能夠直接調用 sorted() 方法對元素進行排序,如:

Comparator.comparingInt

反之, 須要調用 sorted((T, T) -> int) 實現 Comparator 接口。

//sorted()
List<User> sortedList = distinctList.stream().sorted(Comparator.comparingInt(User::getAge))
        .collect(toList());

打印結果:

在這裏插入圖片描述

結果按照年齡從小到大進行排序。

5)limit() 返回前n個元素

若是想知道這裏面年齡最小的是誰,可做以下操做:

//limit 返回前n個元素
List<User> limitList = sortedList.stream().limit(1)
        .collect(toList());

在這裏插入圖片描述

6)skip()

與limit偏偏相反,skip的意思是跳過,也就是去除前n個元素。

打印結果:

在這裏插入圖片描述

果真,前兩我的都被去除了,只剩下最老的葫蘆娃爺爺。

3.2 映射

1)map(T->R)

map是將T類型的數據轉爲R類型的數據,好比咱們想要設置一個新的list,存儲用戶全部的城市信息。

//map(T->R)
List<String> cityList = list.stream().map(User::getAddress).distinct().collect(toList());

打印結果:

在這裏插入圖片描述

2)flatMap(T -> Stream<R>)

將流中的每個元素 T 映射爲一個流,再把每個流鏈接成爲一個流。

//flatMap(T -> Stream<R>)
List<String> flatList = new ArrayList<>();
flatList.add("唱,跳");
flatList.add("rape,籃球,music");
flatList = flatList.stream().map(s -> s.split(",")).flatMap(Arrays::stream).collect(toList());

打印結果:

在這裏插入圖片描述

這裏原集合中的數據由逗號分割,使用split進行拆分後,獲得的是Stream<String[]>,字符串數組組成的流,要使用flatMap的

Arrays::stream

將Stream<String[]>轉爲Stream<String>,而後把流相鏈接,組成了完整的唱、跳、rap、籃球和music。

3.3 查找

1)allMatch(T->boolean)

檢測是否所有知足參數行爲,假如這些用戶是網吧上網的用戶名單,那就須要檢查是否是每一個人都年滿18週歲了。

boolean isAdult = list.stream().allMatch(user -> user.getAge() >= 18);

打印結果:

true

2)anyMatch(T->boolean)

檢測是否有任意元素知足給定的條件,好比,想知道同窗名單裏是否有女生。

//anyMatch(T -> boolean) 是否有任意一個元素知足給定的條件
boolean isGirl = list.stream().anyMatch(user -> user.getSex() == 1);

打印結果:

true

說明集合中有女生存在。

3)noneMatch(T -> boolean)

流中是否有元素匹配給定的 T -> boolean 條件。

好比檢測有沒有來自巴黎的用戶。

boolean isLSJ = list.stream().noneMatch(user -> user.getAddress().contains("巴黎"));

打印結果:

true

打印true說明沒有巴黎的用戶。

4)findFirst( ):找到第一個元素

Optional<User> fristUser  = list.stream().findFirst();

打印結果:

User(name=鋼鐵俠, age=40, sex=0, address=華盛頓)

5)findAny():找到任意一個元素

Optional<User> anyUser  = list.stream().findAny();

打印結果:

User(name=鋼鐵俠, age=40, sex=0, address=華盛頓)

這裏咱們發現findAny返回的也老是第一個元素,那麼爲何還要進行區分呢?由於在並行流 parallelStream() 中找到的確實是任意一個元素。

Optional<User> anyParallelUser  = list.parallelStream().findAny();

打印結果 :

Optional[User(name=李世民, age=60, sex=0, address=山西省太原市)]

3.4 概括計算

1)求用戶的總人數

long count = list.stream().collect(Collectors.counting());

咱們能夠簡寫爲:

long count = list.stream().count();

運行結果:

8

2)獲得某一屬性的最大最小值

// 求最大年齡
Optional<User> max = list.stream().collect(Collectors.maxBy(
Comparator.comparing(User::getAge)));

// 求最小年齡
Optional<User> min = list.stream().collect(Collectors.minBy(
Comparator.comparing(User::getAge)));

運行結果:

在這裏插入圖片描述

在這裏插入圖片描述

3)求年齡總和是多少

// 求年齡總和
int totalAge = list.stream().collect(Collectors.summingInt(User::getAge));

運行結果:

313

咱們常常會用BigDecimal來記錄金錢,假設想獲得BigDecimal的總和:

// 得到列表對象金額, 使用reduce聚合函數,實現累加器
BigDecimal sum = myList.stream() .map(User::getMoney)
.reduce(BigDecimal.ZERO,BigDecimal::add);

4)求年齡平均值

//求年齡平均值
double avgAge = list.stream().collect(
Collectors.averagingInt(User::getAge));

運行結果:

39.125

5)一次性獲得元素的個數、總和、最大值、最小值

IntSummaryStatistics statistics = list.stream().collect(
Collectors.summarizingInt(User::getAge));

運行結果:

在這裏插入圖片描述

6)字符串拼接

要將用戶的姓名連成一個字符串並用逗號分割。

String names = list.stream().map(User::getName)
.collect(Collectors.joining(", "));

運行結果:

鋼鐵俠, 鋼鐵俠, 蜘蛛俠, 趙麗穎, 詹姆斯, 李世民, 蔡徐坤, 葫蘆娃的爺爺

3.5 分組

在數據庫操做中,咱們常常經過GROUP BY關鍵字對查詢到的數據進行分組,java8的流式處理也提供了分組的功能。使用Collectors.groupingBy來進行分組。

1)能夠根據用戶所在城市進行分組

Map<String, List<User>> cityMap = list.stream()
.collect(Collectors.groupingBy(User::getAddress));

在這裏插入圖片描述

結果是一個map,key爲不重複的城市名,value爲屬於該城市的用戶列表。已經實現了分組。

2)二級分組,先根據城市分組再根據性別分組

Map<String, Map<Integer, List<User>>> group = list.stream().collect(
        Collectors.groupingBy(User::getAddress, // 一級分組,按所在地區
                Collectors.groupingBy(User::getSex))); // 二級分組,按性別

運行結果:

在這裏插入圖片描述

3)若是僅僅想統計各城市的用戶個數是多少,並不須要對應的list

按城市分組並統計人數:

Map<String, Long> cityCountMap = list.stream()
.collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));

運行結果:

在這裏插入圖片描述

4)固然,也能夠先進行過濾再分組並統計人數

Map<String,Long> map = list.stream().filter(user -> user.getAge() <= 30)
        .collect(Collectors.groupingBy(User::getAddress,Collectors.counting()));

運行結果:

在這裏插入圖片描述

5)partitioningBy 分區

分區與分組的區別在於,分區是按照 truefalse 來分的,所以partitioningBy 接受的參數的 lambda 也是 T -> boolean

//根據年齡是否小於等於30來分區
Map<Boolean, List<User>> part = list.stream()
        .collect(partitioningBy(user -> user.getAge() <= 30));

運行結果:

在這裏插入圖片描述

總結

到目前爲止,stream的功能咱們已經用了不少了,感受有點眼花繚亂卻無所不能,stream能作的事情遠遠不止這些。

咱們能夠多學習使用stream,把原來複雜的sql查詢,一遍又一遍地for循環的複雜代碼重構,讓代碼更簡潔易懂,可讀性強。

拓展閱讀:Redis專題(1):構建知識圖譜

Redis專題(2):Redis數據結構底層探祕

做者:楊亨

來源:宜信技術學院

相關文章
相關標籤/搜索