1、Stream初體驗git
Stream是Java8中操做集合的一個重要特性,咱們先來看看Java裏面是怎麼定義Stream的:算法
"A sequence of elements supporting sequential and parallel aggregate operations."
咱們來解讀一下上面的那句話:編程
一、Stream是元素的集合,這點讓Stream看起來用些相似Iterator;設計模式
二、能夠支持順序和並行的對原Stream進行匯聚的操做。微信
你們能夠把Stream當成一個高級版本的Iterator。原始版本的Iterator,用戶只能一個一個的遍歷元素並對其執行某些操做;高級版本的Stream,用戶只要給出須要對其包含的元素執行什麼操做,好比「過濾掉長度大於10的字符串」、「獲取每一個字符串的首字母」等,具體這些操做如何應用到每一個元素上,交給Stream就行了!你們看完這些可能對Stream尚未一個直觀的認識,莫急,我們來段代碼。多線程
//Lists是Guava中的一個工具類 List<Integer> nums = Lists.newArrayList(1,null,3,4,null,6); nums.stream().filter(num -> num != null).count();
上面這段代碼是獲取一個List中,元素不爲null的個數。這段代碼雖然很簡短,可是倒是一個很好的入門級別的例子來體現如何使用Stream,正所謂「麻雀雖小五臟俱全」。咱們如今開始深刻解刨這個例子,完成之後你可能能夠基本掌握Stream的用法!併發
剖析Stream通用語法app
圖片就是對於Stream例子的一個解析,能夠很清楚的看見:本來一條語句被三種顏色的框分割成了三個部分。紅色框中的語句是一個Stream的生命開始的地方,負責建立一個Stream實例;綠色框中的語句是賦予Stream靈魂的地方,把一個Stream轉換成另一個Stream,紅框的語句生成的是一個包含全部nums變量的Stream,進過綠框的filter方法之後,從新生成了一個過濾掉原nums列表全部null之後的Stream;藍色框中的語句是豐收的地方,把Stream的裏面包含的內容按照某種算法來匯聚成一個值,例子中是獲取Stream中包含的元素個數。若是這樣解析之後,還不理解,那就只能動用「核武器」–圖形化,一圖抵千言!
在此咱們總結一下使用Stream的基本步驟:
一、建立Stream;
二、轉換Stream,每次轉換原有Stream對象不改變,返回一個新的Stream對象(**能夠有屢次轉換**);
三、對Stream進行聚合(Reduce)操做,獲取想要的結果。
2、建立Stream
最經常使用的建立Stream有兩種途徑:
經過Stream接口的靜態工廠方法(注意:Java8裏接口能夠帶靜態方法);
經過Collection接口的默認方法(默認方法:Default method,也是Java8中的一個新特性,就是接口中的一個帶有實現的方法)–stream(),把一個Collection對象轉換成Stream。
一、使用Stream靜態方法來建立Stream
(1)of方法:有兩個overload方法,一個接收變長參數,一個接收單一值。
Stream<Integer> integerStream = Stream.of(1, 2, 3, 5);
Stream<String> stringStream = Stream.of("taobao");
(2)generator方法:生成一個無限長度的Stream,其元素的生成是經過給定的Supplier(這個接口能夠當作一個對象的工廠,每次調用返回一個給定類型的對象)
Stream.generate(new Supplier<Double>() { @Override public Double get() { return Math.random(); } }); Stream.generate(() -> Math.random()); Stream.generate(Math::random);
三條語句的做用都是同樣的,只是使用了lambda表達式和方法引用的語法來簡化代碼。每條語句其實都是生成一個無限長度的Stream,其中值是隨機的。這個無限長度Stream是懶加載,通常這種無限長度的Stream都會配合Stream的limit()方法來用。
(3)iterate方法:也是生成無限長度的Stream,和generator不一樣的是,其元素的生成是重複對給定的種子值(seed)調用用戶指定函數來生成的。其中包含的元素能夠認爲是:seed,f(seed),f(f(seed))無限循環
Stream.iterate(1, item -> item + 1).limit(10).forEach(System.out::println);
這段代碼就是先獲取一個無限長度的正整數集合的Stream,而後取出前10個打印。千萬記住使用limit方法,否則會無限打印下去。
二、經過Collection子類獲取Stream
這個在本文的第一個例子中就展現了從List對象獲取其對應的Stream對象,若是查看Java doc就能夠發現Collection接口有一個stream方法,因此其全部子類都均可以獲取對應的Stream對象。
public interface Collection<E> extends Iterable<E> { //其餘方法省略 default Stream<E> stream() { return StreamSupport.stream(spliterator(), false); } }
3、轉換Stream
轉換Stream其實就是把一個Stream經過某些行爲轉換成一個新的Stream。Stream接口中定義了幾個經常使用的轉換方法,下面咱們挑選幾個經常使用的轉換方法來解釋。
一、distinct: 對於Stream中包含的元素進行去重操做(去重邏輯依賴元素的equals方法),新生成的Stream中沒有重複的元素;
distinct方法示意圖
二、filter: 對於Stream中包含的元素使用給定的過濾函數進行過濾操做,新生成的Stream只包含符合條件的元素;
filter方法示意圖:
如下代碼片斷使用 filter 方法過濾出空字符串:
List<String>strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl"); // 獲取空字符串的數量 int count = strings.stream().filter(string -> string.isEmpty()).count();
三、map: 對於Stream中包含的元素使用給定的轉換函數進行轉換操做,新生成的Stream只包含轉換生成的元素。這個方法有三個對於原始類型的變種方法,分別是:mapToInt,mapToLong和mapToDouble。這三個方法也比較好理解,好比mapToInt就是把原始Stream轉換成一個新的Stream,這個新生成的Stream中的元素都是int類型。之因此會有這樣三個變種方法,能夠免除自動裝箱/拆箱的額外消耗;
map方法示意圖:
map 方法用於映射每一個元素到對應的結果,如下代碼片斷使用 map 輸出了元素對應的平方數:
List<Integer> numbers = Arrays.asList(3, 2, 2, 3, 7, 3, 5); // 獲取對應的平方數 List<Integer> squaresList = numbers.stream().map( i -> i*i).distinct().collect(Collectors.toList());
四、flatMap:和map相似,不一樣的是其每一個元素轉換獲得的是Stream對象,會把子Stream中的元素壓縮到父集合中;
flatMap方法示意圖:
五、peek: 生成一個包含原Stream的全部元素的新Stream,同時會提供一個消費函數(Consumer實例),新Stream每一個元素被消費的時候都會執行給定的消費函數;
peek方法示意圖:
六、limit: 對一個Stream進行截斷操做,獲取其前N個元素,若是原Stream中包含的元素個數小於N,那就獲取其全部的元素;
limit方法示意圖:
七、skip:返回一個丟棄原Stream的前N個元素後剩下元素組成的新Stream,若是原Stream中包含的元素個數小於N,那麼返回空Stream;
skip方法示意圖:
八、綜合示例
package com.demo; import java.util.List; import org.junit.Test; import com.google.common.collect.Lists; public class TestStream { @Test public void test(){ List<Integer> nums = Lists.newArrayList(1,1,null,2,3,4,null,5,6,7,8,9,10); System.out.println("sum is:"+nums.stream().filter(num -> num!=null).distinct() .mapToInt(num -> num*2).peek(System.out::println).skip(2).limit(4).sum()); } }
運行結果:
2
4
6
8
10
12
sum is:36
這段代碼演示了上面介紹的全部轉換方法(除了flatMap),簡單解釋一下這段代碼的含義:給定一個Integer類型的List,獲取其對應的Stream對象,而後進行過濾掉null,再去重,再每一個元素乘以2,再每一個元素被消費的時候打印自身,在跳過前兩個元素,最後取前四個元素進行加和運算(解釋一大堆,很像廢話,由於基本看了方法名就知道要作什麼了。這個就是聲明式編程的一大好處!)。
九、性能問題
有些細心的同窗可能會有這樣的疑問:在對於一個Stream進行屢次轉換操做,每次都對Stream的每一個元素進行轉換,並且是執行屢次,這樣時間複雜度就是一個for循環裏把全部操做都作掉的N(轉換的次數)倍啊。其實不是這樣的,轉換操做都是lazy的,多個轉換操做只會在匯聚操做(見下面)的時候融合起來,一次循環完成。咱們能夠這樣簡單的理解,Stream裏有個操做函數的集合,每次轉換操做就是把轉換函數放入這個集合中,在匯聚操做的時候循環Stream對應的集合,而後對每一個元素執行全部的函數。
4、匯聚(Reduce)Stream
在介紹匯聚操做以前,咱們先看一下Java doc中對於其定義:
"A reduction operation (also called a fold) takes a sequence of input elements and combines them into a single summary result by repeated
application of a combining operation, such as finding the sum or maximum of a set of numbers, or accumulating elements into a list.
The streams classes have multiple forms of general reduction operations, called reduce() and collect(), as well as multiple specialized
reduction forms such as sum(), max(), or count()."
簡單翻譯一下:匯聚操做(也稱爲摺疊)接受一個元素序列爲輸入,反覆使用某個合併操做,把序列中的元素合併成一個彙總的結果。好比查找一個數字列表的總和或者最大值,或者把這些數字累積成一個List對象。Stream接口有一些通用的匯聚操做,好比reduce()和collect();也有一些特定用途的匯聚操做,好比sum(),max()和count()。注意:sum方法不是全部的Stream對象都有的,只有IntStream、LongStream和DoubleStream是實例纔有。
下面會分兩部分來介紹匯聚操做:
可變匯聚:把輸入的元素們累積到一個可變的容器中,好比Collection或者StringBuilder;
其餘匯聚:除去可變匯聚剩下的,通常都不是經過反覆修改某個可變對象,而是經過把前一次的匯聚結果當成下一次的入參,反覆如此。好比reduce,count,allMatch;
一、可變匯聚
可變匯聚對應的只有一個方法:collect,正如其名字顯示的,它能夠把Stream中的要有元素收集到一個結果容器中(好比Collection)。先看一下最通用的collect方法的定義(還有其餘override方法):
<R> R collect(Supplier<R> supplier, BiConsumer<R, ? super T> accumulator, BiConsumer<R, R> combiner);
先來看看這三個參數的含義:Supplier supplier是一個工廠函數,用來生成一個新的容器;BiConsumer accumulator也是一個函數,用來把Stream中的元素添加到結果容器中;BiConsumer combiner仍是一個函數,用來把中間狀態的多個結果容器合併成爲一個(併發的時候會用到)。看暈了?來段代碼!
List<Integer> nums = Lists.newArrayList(1,1,null,2,3,4,null,5,6,7,8,9,10); List<Integer> numsWithoutNull = nums.stream().filter(num -> num != null).collect(() -> new ArrayList<Integer>(), (list, item) -> list.add(item), (list1, list2) -> list1.addAll(list2));
上面這段代碼就是對一個元素是Integer類型的List,先過濾掉所有的null,而後把剩下的元素收集到一個新的List中。進一步看一下collect方法的三個參數,都是lambda形式的函數(*上面的代碼可使用方法引用來簡化,留給讀者本身去思考*)。
- 第一個函數生成一個新的ArrayList實例;
- 第二個函數接受兩個參數,第一個是前面生成的ArrayList對象,二個是stream中包含的元素,函數體就是把stream中的元素加入ArrayList對象中。第二個函數被反覆調用直到原stream的元素被消費完畢;
- 第三個函數也是接受兩個參數,這兩個都是ArrayList類型的,函數體就是把第二個ArrayList所有加入到第一個中;
可是上面的collect方法調用也有點太複雜了,不要緊!咱們來看一下collect方法另一個override的版本,其依賴[Collector]。
<R, A> R collect(Collector<? super T, A, R> collector);
這樣清爽多了!還有好消息,Java8還給咱們提供了Collector的工具類–[Collectors],其中已經定義了一些靜態工廠方法,好比:Collectors.toCollection()收集到Collection中, Collectors.toList()收集到List中和Collectors.toSet()收集到Set中。這樣的靜態方法還有不少,這裏就不一一介紹了,你們能夠直接去看JavaDoc。下面看看使用Collectors對於代碼的簡化:
List<Integer> numsWithoutNull = nums.stream().filter(num -> num != null).collect(Collectors.toList());
二、其餘匯聚
– reduce方法:reduce方法很是的通用,後面介紹的count,sum等均可以使用其實現。reduce方法有三個override的方法,本文介紹兩個最經常使用的,最後一個留給讀者本身學習。先來看reduce方法的第一種形式,其方法定義以下:
Optional<T> reduce(BinaryOperator<T> accumulator);
接受一個BinaryOperator類型的參數,在使用的時候咱們能夠用lambda表達式來。
@Test public void test1(){ List<Integer> ints = Lists.newArrayList(1,2,3,4,5,6,7,8,9,10); System.out.println("ints sum is:" + ints.stream().reduce((sum, item) -> sum + item).get()); }
運行結果:
ints sum is:55
能夠看到reduce方法接受一個函數,這個函數有兩個參數,第一個參數是上次函數執行的返回值(也稱爲中間結果),第二個參數是stream中的元素,這個函數把這兩個值相加,獲得的和會被賦值給下次執行這個函數的第一個參數。要注意的是:**第一次執行的時候第一個參數的值是Stream的第一個元素,第二個參數是Stream的第二個元素**。這個方法返回值類型是Optional,這是Java8防止出現NPE的一種可行方法,後面的文章會詳細介紹,這裏就簡單的認爲是一個容器,其中可能會包含0個或者1個對象。
這個過程可視化的結果如圖:
reduce方法還有一個很經常使用的變種:
T reduce(T identity, BinaryOperator<T> accumulator);
這個定義上上面已經介紹過的基本一致,不一樣的是:它容許用戶提供一個循環計算的初始值,若是Stream爲空,就直接返回該值。並且這個方法不會返回Optional,由於其不會出現null值。下面直接給出例子,就再也不作說明了。
@Test public void test2(){ List<Integer> ints = Lists.newArrayList(1,2,3,4,5,6,7,8,9,10); System.out.println("ints sum is:" + ints.stream().reduce(0, (sum, item) -> sum + item)); }
運行結果:
ints sum is:55
– count方法:獲取Stream中元素的個數。比較簡單,這裏就直接給出例子,不作解釋了。
@Test public void test3(){ List<Integer> ints = Lists.newArrayList(1,2,3,4,5,6,7,8,9,10); System.out.println("ints count is:" + ints.stream().count()); }
運行結果:
ints count is:10
– 搜索相關
– allMatch:是否是Stream中的全部元素都知足給定的匹配條件
– anyMatch:Stream中是否存在任何一個元素知足匹配條件
– findFirst: 返回Stream中的第一個元素,若是Stream爲空,返回空Optional
– noneMatch:是否是Stream中的全部元素都不知足給定的匹配條件
– max和min:使用給定的比較器(Operator),返回Stream中的最大|最小值
下面給出allMatch和max的例子,剩下的方法讀者當成練習。