Scala函數式編程（三） scala集合和函數

時間 2019-12-20

標籤 scala 函數編程集合欄目 Scala 简体版

原文原文鏈接

前情提要：

Scala函數式編程指南（一）函數式思想介紹html

scala函數式編程（二） scala基礎語法介紹java

前面已經稍微介紹了scala的經常使用語法以及面向對象的一些簡要知識，此次是補充上一章的，主要會介紹集合和函數。python

注意噢，函數和方法是不同的，方法是在類裏面定義的，函數是能夠單獨存在的（嚴格來講，在scala內部，每一個函數都是一個類）算法

一.scala集合介紹

還記得上一章介紹的object的apply方法嗎，不少數據結構其實都用到了它，從而讓咱們能夠直接用List(...)這樣來新建一個List，而不用本身手動new一個。編程

PS：注意，scala默認的數據結構都是不可變的，就是說一個List，無法刪除或增長新的元素。固然，也有「可變」的數據結構，後面會介紹到。數組

1.1 List

得益於apply方法，咱們能夠不經過new來新建數據結構。數據結構

//經過工廠，新建一個List，這個List是不可變的
scala> val numbers = List(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
numbers: List[Int] = List(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)

1.2 元組Tuple

Tuple這個概念在python應用比較普遍，它能夠將多種數據類型（Int,String,Double等）打包在一塊兒app

scala> val tup = (1,1,2.1,"tuple",'c')  //將多種不一樣數據結構打包一塊兒，能夠有重複
tup: (Int, Int, Double, String, Char) = (1,1,2.1,tuple,c)

但在scala中，Tuple是有長度限制的，那就是一個Tuple最多隻能有22個元素。ide

scala> val tup = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21)
tup: (Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int) = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21)

//一個Tuple超過22個元素，報錯了
scala> val tup = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22)
<console>:1: error: too many elements for tuple: 23, allowed: 22
val tup = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22)

能夠看到上面，一但一個Tuple超過22個元素，就會報錯了。至於爲何是22這個神奇的數字，好像一直沒有一個統一的論調。有人開玩笑的說23纔對，由於有部電影的名字叫《The Number 23》~~函數式編程

1.3 Map和Option

在說Map以前，須要先介紹Option，由於Map裏面存的就是Option，這個後面介紹。

Option翻譯過來是選項，本質上，它也確實是一個選項，用來告訴你存不存在。仍是用實例說明吧：

//Option裏面能夠存普通數據類型
scala> val optionInt = Option(1)
optionInt: Option[Int] = Some(1)

scala> optionInt.get
res8: Int = 1
//但一個Option也可能爲空
scala> val optionNone = Option(null)
optionNone: Option[Null] = None
//當Option裏面是空的時候，是get不出東西的，還會報錯
scala> optionNone.get
java.util.NoSuchElementException: None.get
  at scala.None$.get(Option.scala:347)
  at scala.None$.get(Option.scala:345)
  ... 32 elided
//這個時候能夠判斷它就是空的
scala> optionNone.isEmpty
res11: Boolean = true
//但能夠用getOrElse()方法，當Option裏面有東西的時候，就返回那個東西，若是沒有東西，就返回getOrElse()的參數的內容
scala> optionNone.getOrElse("this is null")  //裏面沒東西
res12: String = this is null
scala> optionInt.getOrElse("this is null") //裏面有東西
res15: Any = 1

再說Map，Map裏面的value的類型並非你賦的那個數據類型，而是Option。即Map(key -> Option,key1 -> Option)。

scala> val map = Map("test1" -> 1,"test2" -> 2)
map: scala.collection.immutable.Map[String,Int] = Map(test1 -> 1, test2 -> 2)

scala> map.get("test1")
res16: Option[Int] = Some(1)

scala> map.get("test3")
res17: Option[Int] = None

scala> map.get("test3").getOrElse("this is null")
res18: Any = this is null

這樣的好處是什麼呢？還記得在java裏面，每次都得爲java爲空的狀況作判斷的痛苦嗎。在scala，這些煩惱統統不存在。有了Option，媽媽不再用擔憂NullPointerException啦。

1.4 經常使用函數組合子

匿名函數

將集合的函數組合子，那確定得先將匿名函數。若是有用過python中的lambda表達式，那應該就很瞭解這種方式了。

前面說到，在scala中，函數就是對象，匿名函數也是函數。舉個簡單的例子：

//建立一個匿名函數
scala> val addOne = (x: Int) => x + 1
addOne: (Int) => Int = <function1>

scala> addOne(1)
res4: Int = 2

注意，函數裏面是能夠不用return的，最後面的那個x+1就是匿名函數的返回值了。

map，reduce

由於hadoop的出現，MapReduce都被說爛了。雖然Hadoop的Mapreduce起源自函數式的map和reduce，但二者實際上是不同的。感興趣的能夠看看我以前寫過的一篇：從分治算法到 Hadoop MapReduce

函數式裏面的map呢，粗略的說，其實至關一個有返回值的for循環。

scala> val list = List(1,2,3)
list: List[Int] = List(1, 2, 3)

scala> list.map(_ + 1)   //這裏的(_+1)其實就是一個匿名函數 //讓List中每個元素+1，並返回
res29: List[Int] = List(2, 3, 4)

至於reduce呢，也是像for循環，只是不像map每次循環是當前元素，reduce除了當前元素，還有上一次循環的結果，仍是看看例子吧：

scala> list.reduce((i,j) => i + j)  //兩個兩個一塊兒循環，這裏是讓兩個相加
res28: Int = 6

好比上面的例子，有1,2,3三個數。第一次循環的兩個是1,2，1+2就等於3，第二次循環就是上次的結果3和本來的3，3+3等於6，結果就是6。

filter

filter故名思意，就是過濾的意思，能夠在filter中傳進去一個匿名函數，返回布爾值。返回true的則保留，返回false的丟棄。

scala> val numbers = List(1, 2, 3, 4)
numbers: List[Int] = List(1, 2, 3, 4)

//過濾出餘2等於0的
scala> numbers.filter((i: Int) => i % 2 == 0)
res0: List[Int] = List(2, 4)

foldLeft

這個和reduce相似，也是遍歷，除了當前元素，還有上一次迭代的結果。區別在於foldLeft有一個初始值。

scala> val numbers = List(1, 2, 3, 4)
numbers: List[Int] = List(1, 2, 3, 4)

//(m: Int, n: Int) => m + n這部分是一個匿名函數
scala> numbers.foldLeft(0)((m: Int, n: Int) => m + n)
res30: Int = 10

二.scala函數

在最前面有介紹到，函數就是對象。那爲何函數能直接運行呢？這其實得益於object的apply這個語法糖。

偏函數

偏函數（PartialFunction），從某種意義上來講，偏函數也是scala中挺重要的一個語法糖。

偏函數它長這樣：

PartialFunction[A, B] //接收一個A類型的參數，返回B類型的參數

值得一提的是，scala中有一個關鍵字case，就是使用偏函數。繼續舉例子：

//下面的case就是一個偏函數PartialFunction[Int, String]
scala> val one: PartialFunction[Int, String] = { case 1 => "one" }
one: PartialFunction[Int,String] = <function1>

scala> one(1)
res11: String = Int

scala> one("one")
<console>:13: error: type mismatch;
 found   : String("one")
 required: Int
       one("one")

case關鍵字會匹配符合條件的類型或值，若是不符合，會報錯。內部實現就不介紹了，知道是個經常使用語法糖就好。

而這個case關鍵字也正是實現scala模式匹配中，必不可少的一環，有興趣的童鞋能夠看看我這篇：scala模式匹配詳細解析

這裏再說一個常見應用吧，函數組合子中有一個collect，它須要的參數就是一個偏函數。下面看個有意思的例子：

//這個list裏面的Any類型
scala> val list:List[Any] = List(1, 3, 5, "seven")
list: List[Any] = List(1, 3, 5, seven)

//使用map會報錯，由於map接收的參數是普通函
scala> list.map { case i: Int => i + 1 }
scala.MatchError: seven (of class java.lang.String)
  at $anonfun$1.apply(<console>:13)
  at $anonfun$1.apply(<console>:13)
  at scala.collection.immutable.List.map(List.scala:277)
  ... 32 elided

  //但若是用collect函數就能夠，由於collect接收的參數是偏函數，它會自動使用偏函數的一些特性，因此能夠自動過濾掉不符合的數據類型
scala> list.collect { case i: Int => i + 1 }
res15: List[Int] = List(2, 4, 6)

由於collect接收的參數是偏函數，它會自動使用偏函數的特性，自動過濾不符合的數據類型，而map就作不到。

部分應用函數

所謂部分應用的意思，就是說，當調用一個函數時，能夠僅傳遞一部分參數。而這樣會生成一個新的函數，來個實例看看吧：

//定義一個打印兩個輸出參數的函數
scala> def partial(i:Int,j:Int) : Unit = {
     |     println(i)
     |     println(j)
     | }
partial: (i: Int,j: Int)Unit

//賦一個值給上面那個函數，另外一個參數不賦值，生成一個新的函數
scala> val partialFun = partial(5,_:Int)
partialFun: Int => Unit = <function1>

//只要一個參數就能夠調用啦
scala> partialFun(10)
5
10

部分應用函數，主要是做用是代碼複用，同時也可以增長必定的代碼可讀性。

固然還有更多有意思的用法，後面有機會說到再說。

函數柯里化

剛開始，聽到柯里化的時候很奇怪。柯里？啥玩意？

後來才知道，其實柯里是從curry音譯過來的，這個是我的名，就是發明了柯里化的發明人。

柯里化是把接受多個參數的函數變換成接受一個單一參數(最初函數的第一個參數)的函數，而且返回接受餘下的參數且返回結果的新函數的技術。

看看具體是怎麼使用吧：

//咱們知道函數能夠這樣定義，讓它接收兩個參數
scala> def curring(i:Int)(j: Int): Boolean = {false}
curring: (i: Int)(j: Int)Boolean

//能夠把這個函數賦值給一個變量，注意變量的類型
scala> val curringVal:(Int => (Int => Boolean)) = curring _
curringVal: Int => (Int => Boolean) = <function1>

//可讓這個變量接收一個參數，又變成另外一個函數了
scala> val curringVal_1 = curringVal(5)
curringVal_1: Int => Boolean = <function1>

//再用這個變量接收一個參數，終於能返回結果了
scala> curringVal_1(10)
res32: Boolean = false

柯里化實際上是把一個函數變成一個調用鏈的過程，和上面的部分應用函數看起來有點像。

這幾個部分初次看可能不知道它究竟有什麼用，其實這些功能的一個主要用途是函數式的依賴注入。經過這部分技術能夠把被依賴的函數以參數的形式傳遞給上層函數。限於篇幅這裏就先省略，後面再介紹。