前情提要html
Scala函數式編程(三) scala集合和函數python
今天介紹的內容,主要是對上一篇介紹的scala函數式數據結構補充,主要講代碼。能夠先看看上一節,主要講的是函數式的list,Scala函數式編程(四)函數式的數據結構 上。這些代碼我都放在個人公衆號裏面,包括函數式的List以及一個函數式的二叉搜索樹,關注公衆號:哈爾的數據城堡,回覆「scala樹數據結構」就能直接得到(寫文章不容易,大哥大姐關注下吧 :) )。數據結構
話說回來,上一篇中,主要介紹了List的一些基礎用法,包括定義基礎的結構,節點Cons和結尾的Nil。以及使用一個object List來定義基礎的List操做。app
//定義List爲特質,Nil和Cons爲結尾和中間的Node sealed trait List[+A] case object Nil extends List[Nothing] case class Cons[+A](head: A, tail: List[A]) extends List[A] { override def toString: String = s"$head :: ${tail.toString}" } //Listc操做的定義方法,object至關於java中的靜態類,裏面的方法能夠直接調用 object List { def sum(ints: List[Int]): Int = ints match { case Nil => 0 case Cons(x,xs) => x + sum(xs) } def map[A,B](l: List[A],f: A => B): List[B] =l match { case Nil => Nil case Cons(head, tail) =>Cons(f(head), map(tail,f)) } def apply[A](a: A*): List[A] = if (a.isEmpty) Nil else Cons(a.head, apply(a.tail: _*)) def empty[A]: List[A] = Nil object ops { //定義隱式轉換,這個是爲了擴充List的操做而準備的,能夠看看最下面是若是使用的 implicit def listOps[A](list: List[A]): ListOps[A] = new ListOps(list) } }
關於節點Cons和Nil的定義和上一節同樣,只是Cons多了個重寫的toString方法。ide
簡單再說下,這裏呢,在object List裏面,在裏面咱們定義了apply方法,能夠初始化生成一個List。以及上一節提到的sum和map方法。若是對這些看不明白能夠看看上一節的內容。函數式編程
但這樣的話當咱們要調用sum方法的時候,只能經過object List來調用,相似下面這樣:函數
//使用object List裏面的apply方法初始化,生成List scala> val numList = List(1,2,3,4) numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil //使用object List裏面的sum方法 scala> List.sum(numList) res0: Int = 10
可是呢,咱們平常使用的時候可不是這樣呀,咱們更熟悉的應該是要這樣:
//使用object List裏面的apply方法初始化,生成List scala> val numList = List(1,2,3,4) numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil //直接使用numList內置的方法來處理 scala> numList.sum() res0: Int = 10
更加通用的作法,應該是經過List自己,來調用方法,就像上面看到的那樣。一般的作法,是直接加在Cons裏面,但因爲Cons是繼承自trait List[+A],因此你們(包括)Nil裏面都須要定義那一堆方法了,有沒有別的辦法呢?
有的,scala的又一個語法糖,隱式轉換,就是上面object List裏面的ops。
object ops { //定義隱式轉換,這個是爲了擴充List的操做而準備的,能夠看看最下面是若是使用的 implicit def listOps[A](list: List[A]): ListOps[A] = new ListOps(list) }
隱式轉換主要是經過implicit這個關鍵字定義的,固然隱式轉換還有其餘用法,無論這裏的用法算是最多見的用法了。
隱式轉換函數,看的主要是參數,以及返回,函數名字(這裏名字是listOps)是不重要的,起什麼都不要緊。
隱式轉換的做用這裏很少解釋,能夠百度看看,簡單說就是在須要的時候,將一個類型轉換成另外一種類型。這裏的做用,是在特定的狀況下將咱們定義的List轉成ListOps類型,而ListOps類,則在下面給出。
//擴充List的操做 private[list] final class ListOps[A](list: List[A]) { //導入隱式轉換函數,由於下面的處理也是須要隱式轉換 import List.ops._ //使用遞歸實現,foldRight的實現就是調用了這個函數,這麼作是爲了複用 //代碼複用是函數式中很重要的一個特性,看下面append方法就能夠明白 def foldRightAsPrimary[B](z: B)(f: (A, B) => B): B = list match { case Nil => z case Cons(head, tail) => f(head, tail.foldRightAsPrimary(z)(f)) } def foldRight[B](z: B)(f: (A, B) => B): B = foldRightViaFoldLeft(z)(f) def map[B](f: A=> B): List[B] = list match { case Nil => Nil case Cons(head, tail) => Cons(f(head), tail.map(f)) } }
有了這段代碼後,當咱們須要使用map的時候,就能夠不用再借助object List代勞,而能夠直接使用,就像這樣:
//使用object List裏面的apply方法初始化,生成List scala> val numList = List(1,2,3,4) numList: List[Int] = 1 :: 2 :: 3 :: 4 :: Nil //直接使用numList內置的方法來處理,而不是List.map(numList,function) scala> numList.map(function)
當代碼檢測到List調用map方法,但List內部並無map方法,就會觸發隱式轉換,轉換成ListOps類型,調用ListOps類型裏面的map方法,而後返回一個List做爲結果。雖然通過了諸多波折,但調用者是感覺不到的,反而感受就像是List裏面自己的map方法同樣。在Spark裏面就有不少這樣的操做。
如上面的代碼,如今咱們能夠直接使用numList.map(function)這樣的方式,就像List裏面自己就有map函數同樣來使用了。
在上一篇末尾,給出了一份還未完成的數據結構,二叉搜索樹看成練習。這一節就來說講這個。
其實若是把以前的List都看懂的話,其實二叉搜索樹並無什麼難點。
二叉搜索樹,是樹,天然就有葉節點和葉子節點(就是末尾)。不過此次和List不同的是,沒有使用隱式轉換,因此咱們定義的就不是特質了,而是先定義一個抽象類。而後讓葉節點和葉子節點繼承它。
//定義一個二叉樹的抽象類 sealed abstract class TreeMap[+A] extends AbstractMap[Int, A] { def add[B >: A](kv: (Int, B)): TreeMap[B] = ??? def deleteMin: ((Int, A), TreeMap[A]) = ??? def delete(key: Int): TreeMap[A] = ??? def get(key: Int): Option[A] = ??? def +[A1 >: A](kv: (Int, A1)): TreeMap[A1] = ??? def -(k: Int): TreeMap[A] = ??? override def toList: List[(Int, A)] = ??? def iterator: Iterator[(Int, A)] =??? } //葉子節點,也就是每一個分支的末尾,繼承了上面的抽象類 case class Leaf() extends TreeMap[Nothing] //葉節點,包含左右和內容,繼承了上面的抽象類 case class Node[+A](key: Int, value: A, left: TreeMap[A], right: TreeMap[A]) extends TreeMap[A]
二叉樹中有有基礎的增刪查操做,還重載了兩個符號,+和-分別表明增長和刪除。對了,這裏的???,其實和python裏面的pass是同樣的,就充當個佔位符,告訴編譯器這裏會有東西的,先別報錯。
而後主要就是要實現二叉樹裏面空缺的代碼,其實熟悉樹結構的同窗應該都知道,遞歸是樹天生的基因。因此這裏天然都是要經過遞歸實現的。不過在編寫前,仍是要提一下,通常函數式編程裏面,不會使用可變變量(var),也不會使用可變的數據結構(ListBuff)。
實現過程也沒什麼好解釋的,其實就是經過遞歸,以及scala的模式匹配,若是碰到葉子節點就掛掉,不是就遞歸去進行。直接看代碼。這裏主要介紹add方法,其餘的基本都是相似的:
sealed abstract class TreeMap[+A] extends AbstractMap[Int, A] { ...... //使用模式匹配,實現遞歸操做,主要是找到對應的位置,插入數據 def add[B >: A](kv: (Int, B)): TreeMap[B] = { val (key, value) = kv //this就是當前的類型,多是葉節點,也多是葉子節點 this match { case Node(nodeKey, nodeValue, left, right) => { //按照二叉搜索樹的規則,進行遞歸 if(nodeKey > key) Node(nodeKey, nodeValue, left.add((key,value)), right) else if(nodeKey < key) Node(nodeKey, nodeValue, left, right.add((key,value))) else Node(nodeKey, value, left, right) } //若是是葉子節點,則新生成一個葉節點,返回 case Leaf() => { Node(key, value, Leaf(), Leaf()) } } ...... }
根據二叉搜索樹的規則,新鍵大於節點的鍵的時候,插入右邊,小於節點的鍵的時候,插入到左邊。而後約定好結束條件,也就是碰到葉子節點的時候返回。這樣一來就完成了插入的操做。後面不管是刪除,仍是查找,都是一樣的思路。
而重載運算符方法,好比重載+方法,就是直接調用上面的add方法,即直接複用。而後看看object TreeMap。
object TreeMap { def empty[A]: TreeMap[A] = Leaf() def apply[A](kvs: (Int, A)*): TreeMap[A] = { kvs.toSeq.foldLeft(empty[A])(_ + _) } }
這個object主要做用有兩個,一個是生成葉子節點,一個是初始化一棵樹(注意是apply方法)。和List同樣,這裏也是用多參數的輸入方式,不一樣的是這裏沒有用遞歸,而是直接把多個參數轉化成一個序列,而後用foldLeft,逐個累加。從而實現初始化樹。
OK,到這裏就結束了,最後仍是但願你可以本身試着寫下tree的代碼,寫完再用test case測試下,編程功底就是這樣一步一步打下的。
函數式的數據結構篇到此就結束,但願在這裏,你能明白函數式的數據結構與咱們最開始接觸到的數據結構的實現有哪些不一樣,又爲什麼要大費周章用函數式的方式實現!!
不少scala的教程介紹到這裏就一句話,scala的默認數據結構是不可變的,若是可變的要怎樣巴拉巴拉,這樣容易讓人陷入知其然不知其因此然的地步。
同時我也一直決定,學習語言的話,語法知識最表層的東西。真正深刻學習一門語言,你須要逐漸知道這門語言在設計上的取捨,甚至是設計上的哲學,好比python的至簡哲學。
而在深刻這些東西的過程當中,語法天然而然就掌握了,好比較爲晦澀的隱式轉換。在這裏就會知道隱式轉換是這樣用的,原來spark裏面一直都有這個東西參與!!!
接下來一篇將介紹scala中的錯誤處理方式,依舊是函數式的處理方式,像java中的try{}catch{}確定是非函數式的,那麼scala是怎麼實現的呢,下一篇就來介紹:)
若是有什麼疑問,也歡迎留言。
以上~