前面已經稍微介紹了scala的經常使用語法以及面向對象的一些簡要知識,此次是補充上一章的,主要會介紹集合和函數。python
注意噢,函數和方法是不同的,方法是在類裏面定義的,函數是能夠單獨存在的(嚴格來講,在scala內部,每一個函數都是一個類)算法
還記得上一章介紹的object的apply方法嗎,不少數據結構其實都用到了它,從而讓咱們能夠直接用List(...)這樣來新建一個List,而不用本身手動new一個。編程
PS:注意,scala默認的數據結構都是不可變的,就是說一個List,無法刪除或增長新的元素。固然,也有「可變」的數據結構,後面會介紹到。數組
得益於apply方法,咱們能夠不經過new來新建數據結構。數據結構
//經過工廠,新建一個List,這個List是不可變的 scala> val numbers = List(1, 2, 3, 4, 5, 1, 2, 3, 4, 5) numbers: List[Int] = List(1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
Tuple這個概念在python應用比較普遍,它能夠將多種數據類型(Int,String,Double等)打包在一塊兒app
scala> val tup = (1,1,2.1,"tuple",'c') //將多種不一樣數據結構打包一塊兒,能夠有重複 tup: (Int, Int, Double, String, Char) = (1,1,2.1,tuple,c)
但在scala中,Tuple是有長度限制的,那就是一個Tuple最多隻能有22個元素。ide
scala> val tup = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21) tup: (Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int, Int) = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21) //一個Tuple超過22個元素,報錯了 scala> val tup = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22) <console>:1: error: too many elements for tuple: 23, allowed: 22 val tup = (0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22)
能夠看到上面,一但一個Tuple超過22個元素,就會報錯了。至於爲何是22這個神奇的數字,好像一直沒有一個統一的論調。有人開玩笑的說23纔對,由於有部電影的名字叫《The Number 23》~~函數式編程
在說Map以前,須要先介紹Option,由於Map裏面存的就是Option,這個後面介紹。
Option翻譯過來是選項,本質上,它也確實是一個選項,用來告訴你存不存在。仍是用實例說明吧:
//Option裏面能夠存普通數據類型 scala> val optionInt = Option(1) optionInt: Option[Int] = Some(1) scala> optionInt.get res8: Int = 1 //但一個Option也可能爲空 scala> val optionNone = Option(null) optionNone: Option[Null] = None //當Option裏面是空的時候,是get不出東西的,還會報錯 scala> optionNone.get java.util.NoSuchElementException: None.get at scala.None$.get(Option.scala:347) at scala.None$.get(Option.scala:345) ... 32 elided //這個時候能夠判斷它就是空的 scala> optionNone.isEmpty res11: Boolean = true //但能夠用getOrElse()方法,當Option裏面有東西的時候,就返回那個東西,若是沒有東西,就返回getOrElse()的參數的內容 scala> optionNone.getOrElse("this is null") //裏面沒東西 res12: String = this is null scala> optionInt.getOrElse("this is null") //裏面有東西 res15: Any = 1
再說Map,Map裏面的value的類型並非你賦的那個數據類型,而是Option。即Map(key -> Option,key1 -> Option)。
scala> val map = Map("test1" -> 1,"test2" -> 2) map: scala.collection.immutable.Map[String,Int] = Map(test1 -> 1, test2 -> 2) scala> map.get("test1") res16: Option[Int] = Some(1) scala> map.get("test3") res17: Option[Int] = None scala> map.get("test3").getOrElse("this is null") res18: Any = this is null
這樣的好處是什麼呢?還記得在java裏面,每次都得爲java爲空的狀況作判斷的痛苦嗎。在scala,這些煩惱統統不存在。有了Option,媽媽不再用擔憂NullPointerException啦。
將集合的函數組合子,那確定得先將匿名函數。若是有用過python中的lambda表達式,那應該就很瞭解這種方式了。
前面說到,在scala中,函數就是對象,匿名函數也是函數。舉個簡單的例子:
//建立一個匿名函數 scala> val addOne = (x: Int) => x + 1 addOne: (Int) => Int = <function1> scala> addOne(1) res4: Int = 2
注意,函數裏面是能夠不用return的,最後面的那個x+1就是匿名函數的返回值了。
由於hadoop的出現,MapReduce都被說爛了。雖然Hadoop的Mapreduce起源自函數式的map和reduce,但二者實際上是不同的。感興趣的能夠看看我以前寫過的一篇:從分治算法到 Hadoop MapReduce
函數式裏面的map呢,粗略的說,其實至關一個有返回值的for循環。
scala> val list = List(1,2,3) list: List[Int] = List(1, 2, 3) scala> list.map(_ + 1) //這裏的(_+1)其實就是一個匿名函數 //讓List中每個元素+1,並返回 res29: List[Int] = List(2, 3, 4)
至於reduce呢,也是像for循環,只是不像map每次循環是當前元素,reduce除了當前元素,還有上一次循環的結果,仍是看看例子吧:
scala> list.reduce((i,j) => i + j) //兩個兩個一塊兒循環,這裏是讓兩個相加 res28: Int = 6
好比上面的例子,有1,2,3三個數。第一次循環的兩個是1,2,1+2就等於3,第二次循環就是上次的結果3和本來的3,3+3等於6,結果就是6。
filter故名思意,就是過濾的意思,能夠在filter中傳進去一個匿名函數,返回布爾值。返回true的則保留,返回false的丟棄。
scala> val numbers = List(1, 2, 3, 4) numbers: List[Int] = List(1, 2, 3, 4) //過濾出餘2等於0的 scala> numbers.filter((i: Int) => i % 2 == 0) res0: List[Int] = List(2, 4)
這個和reduce相似,也是遍歷,除了當前元素,還有上一次迭代的結果。區別在於foldLeft有一個初始值。
scala> val numbers = List(1, 2, 3, 4) numbers: List[Int] = List(1, 2, 3, 4) //(m: Int, n: Int) => m + n這部分是一個匿名函數 scala> numbers.foldLeft(0)((m: Int, n: Int) => m + n) res30: Int = 10
在最前面有介紹到,函數就是對象。那爲何函數能直接運行呢?這其實得益於object的apply這個語法糖。
偏函數(PartialFunction),從某種意義上來講,偏函數也是scala中挺重要的一個語法糖。
偏函數它長這樣:
PartialFunction[A, B] //接收一個A類型的參數,返回B類型的參數
值得一提的是,scala中有一個關鍵字case,就是使用偏函數。繼續舉例子:
//下面的case就是一個偏函數PartialFunction[Int, String] scala> val one: PartialFunction[Int, String] = { case 1 => "one" } one: PartialFunction[Int,String] = <function1> scala> one(1) res11: String = Int scala> one("one") <console>:13: error: type mismatch; found : String("one") required: Int one("one")
case關鍵字會匹配符合條件的類型或值,若是不符合,會報錯。內部實現就不介紹了,知道是個經常使用語法糖就好。
而這個case關鍵字也正是實現scala模式匹配中,必不可少的一環,有興趣的童鞋能夠看看我這篇:scala模式匹配詳細解析
這裏再說一個常見應用吧,函數組合子中有一個collect,它須要的參數就是一個偏函數。下面看個有意思的例子:
//這個list裏面的Any類型 scala> val list:List[Any] = List(1, 3, 5, "seven") list: List[Any] = List(1, 3, 5, seven) //使用map會報錯,由於map接收的參數是普通函 scala> list.map { case i: Int => i + 1 } scala.MatchError: seven (of class java.lang.String) at $anonfun$1.apply(<console>:13) at $anonfun$1.apply(<console>:13) at scala.collection.immutable.List.map(List.scala:277) ... 32 elided //但若是用collect函數就能夠,由於collect接收的參數是偏函數,它會自動使用偏函數的一些特性,因此能夠自動過濾掉不符合的數據類型 scala> list.collect { case i: Int => i + 1 } res15: List[Int] = List(2, 4, 6)
由於collect接收的參數是偏函數,它會自動使用偏函數的特性,自動過濾不符合的數據類型,而map就作不到。
所謂部分應用的意思,就是說,當調用一個函數時,能夠僅傳遞一部分參數。而這樣會生成一個新的函數,來個實例看看吧:
//定義一個打印兩個輸出參數的函數 scala> def partial(i:Int,j:Int) : Unit = { | println(i) | println(j) | } partial: (i: Int,j: Int)Unit //賦一個值給上面那個函數,另外一個參數不賦值,生成一個新的函數 scala> val partialFun = partial(5,_:Int) partialFun: Int => Unit = <function1> //只要一個參數就能夠調用啦 scala> partialFun(10) 5 10
部分應用函數,主要是做用是代碼複用,同時也可以增長必定的代碼可讀性。
固然還有更多有意思的用法,後面有機會說到再說。
剛開始,聽到柯里化的時候很奇怪。柯里?啥玩意?
後來才知道,其實柯里是從curry音譯過來的,這個是我的名,就是發明了柯里化的發明人。
柯里化是把接受多個參數的函數變換成接受一個單一參數(最初函數的第一個參數)的函數,而且返回接受餘下的參數且返回結果的新函數的技術。
看看具體是怎麼使用吧:
//咱們知道函數能夠這樣定義,讓它接收兩個參數 scala> def curring(i:Int)(j: Int): Boolean = {false} curring: (i: Int)(j: Int)Boolean //能夠把這個函數賦值給一個變量,注意變量的類型 scala> val curringVal:(Int => (Int => Boolean)) = curring _ curringVal: Int => (Int => Boolean) = <function1> //可讓這個變量接收一個參數,又變成另外一個函數了 scala> val curringVal_1 = curringVal(5) curringVal_1: Int => Boolean = <function1> //再用這個變量接收一個參數,終於能返回結果了 scala> curringVal_1(10) res32: Boolean = false
柯里化實際上是把一個函數變成一個調用鏈的過程,和上面的部分應用函數看起來有點像。
這幾個部分初次看可能不知道它究竟有什麼用,其實這些功能的一個主要用途是函數式的依賴注入。經過這部分技術能夠把被依賴的函數以參數的形式傳遞給上層函數。限於篇幅這裏就先省略,後面再介紹。
這次介紹的是scala集合的一些內容,以及一些函數的特性,再說一遍,函數其實就是對象。
我一直有一種觀點,在學習新的東西的時候,一些偏固定規則的東西,好比語法。不用所有記熟,只要知道大概原理,有個映像就行。
好比說scala的函數式編程,或是java的OOP,不須要抱有先把語法學完,再學習相關的編程理念,這在我看來是有點本末倒置了。
我通常的作法,是先熟悉大概的語法,而後去學習語言的精髓。當碰到不懂的時候,再反過來查詢具體的語法,有了目標以後,語法反而變得不是那麼枯燥了。
以上只是個人一些我的見解,那麼本篇到此就結束了。
以上~~