JavaScript 函數式編程導論

JavaScript 函數式編程導論從屬於筆者的Web 前端入門與工程實踐。本文不少地方是講解函數式編程的優點,就筆者我的而言是承認函數式編程具備必定的好處,可是不推崇完全的函數式編程化,特別是對於複雜應用邏輯的開發。筆者在應用的狀態管理工具中就更傾向於使用MobX而不是Redux,詳見2016-個人前端之路:工具化與工程化前端

JavaScript 函數式編程

近年來,函數式編程(Functional Programming)已經成爲了JavaScript社區中煊赫一時的主題之一,不管你是否欣賞這種編程理念,相信你都已經對它有所瞭解。即便是前幾年函數式編程還沒有流行的時候,我已經在不少的大型應用代碼庫中發現了很多對於函數式編程理念的深度實踐。函數式編程便是在軟件開發的工程中避免使用共享狀態(Shared State)、可變狀態(Mutable Data)以及反作用(Side Effects)。函數式編程中整個應用由數據驅動,應用的狀態在不一樣純函數之間流動。與偏向命令式編程的面向對象編程而言,函數式編程其更偏向於聲明式編程,代碼更加簡潔明瞭、更可預測,而且可測試性也更好。。函數式編程本質上也是一種編程範式(Programming Paradigm),其表明了一系列用於構建軟件系統的基本定義準則。其餘編程範式還包括面向對象編程(Object Oriented Programming)與過程程序設計(Procedural Programming)。node

純函數

顧名思義,純函數每每指那些僅根據輸入參數決定輸出而且不會產生任何反作用的函數。純函數最優秀的特性之一在於其結果的可預測性:git

var z = 10;
function add(x, y) {
    return x + y;
}
console.log(add(1, 2)); // prints 3
console.log(add(1, 2)); // still prints 3
console.log(add(1, 2)); // WILL ALWAYS print 3

add函數中並無操做z變量,即沒有讀取z的數值也沒有修改z的值。它僅僅根據參數輸入的xy變量而後返回兩者相加的和。這個add函數就是典型的純函數,而若是在add函數中涉及到了讀取或者修改z變量,那麼它就失去了純潔性。咱們再來看另外一個函數:github

function justTen() {
    return 10;
}

對於這樣並無任何輸入參數的函數,若是它要保持爲純函數,那麼該函數的返回值就必須爲常量。不過像這種固定返回爲常量的函數還不如定義爲某個常量呢,就不必大材小用用函數了,所以咱們能夠認爲絕大部分的有用的純函數至少容許一個輸入參數。再看看下面這個函數:數據庫

function addNoReturn(x, y) {
    var z = x + y
}

注意這個函數並無返回任何值,它確實擁有兩個輸入參數xy,而後將這兩個變量相加賦值給z,所以這樣的函數也能夠認爲是無心義的。這裏咱們能夠說,絕大部分有用的純函數必需要有返回值。總結而言,純函數應該具備如下幾個特效:編程

  • 絕大部分純函數應該擁有一或多個參數值。數組

  • 純函數必需要有返回值。安全

  • 相同輸入的純函數的返回值必須一致。前端框架

  • 純函數不可以產生任何的反作用。網絡

共享狀態與反作用

共享狀態(Shared State)能夠是存在於共享做用域(全局做用域與閉包做用域)或者做爲傳遞到不一樣做用域的對象屬性的任何變量、對象或者內存空間。在面向對象編程中,咱們經常是經過添加屬性到其餘對象的方式共享某個對象。共享狀態問題在於,若是開發者想要理解某個函數的做用,必須去詳細瞭解該函數可能對於每一個共享變量形成的影響。譬如咱們如今須要將客戶端生成的用戶對象保存到服務端,能夠利用saveUser()函數向服務端發起請求,將用戶信息編碼傳遞過去而且等待服務端響應。而就在你發起請求的同時,用戶修改了我的頭像,觸發了另外一個函數updateAvatar()以及另外一次saveUser()請求。正常來講,服務端會先響應第一個請求,而且根據第二個請求中用戶參數的變動對於存儲在內存或者數據庫中的用戶信息做相應的修改。不過某些意外狀況下,可能第二個請求會比第一個請求先到達服務端,這樣用戶選定的新的頭像反而會被第一個請求中的舊頭像覆寫。這裏存放在服務端的用戶信息就是所謂的共享狀態,而由於多個併發請求致使的數據一致性錯亂也就是所謂的競態條件(Race Condition),也是共享狀態致使的典型問題之一。另外一個共享狀態的常見問題在於不一樣的調用順序可能會觸發未知的錯誤,這是由於對於共享狀態的操做每每是時序依賴的。

const x = {
  val: 2
};

const x1 = () => x.val += 1;

const x2 = () => x.val *= 2;

x1();
x2();

console.log(x.val); // 6

const y = {
  val: 2
};

const y1 = () => y.val += 1;

const y2 = () => y.val *= 2;

// 交換了函數調用順序
y2();
y1();

// 最後的結果也受到了影響
console.log(y.val); // 5

反作用指那些在函數調用過程當中沒有經過返回值表現的任何可觀測的應用狀態變化,常見的反作用包括但不限於:

  • 修改任何外部變量或者外部對象屬性

  • 在控制檯中輸出日誌

  • 寫入文件

  • 發起網絡通訊

  • 觸發任何外部進程事件

  • 調用任何其餘具備反作用的函數

在函數式編程中咱們會盡量地規避反作用,保證程序更易於理解與測試。Haskell或者其餘函數式編程語言一般會使用Monads來隔離與封裝反作用。在絕大部分真實的應用場景進行編程開始時,咱們不可能保證系統中的所有函數都是純函數,可是咱們應該儘量地增長純函數的數目而且將有反作用的部分與純函數剝離開來,特別是將業務邏輯抽象爲純函數,來保證軟件更易於擴展、重構、調試、測試與維護。這也是不少前端框架鼓勵開發者將用戶的狀態管理與組件渲染相隔離,構建鬆耦合模塊的緣由。

不變性

不可變對象(Immutable Object)指那些建立以後沒法再被修改的對象,與之相對的可變對象(Mutable Object)指那些建立以後仍然能夠被修改的對象。不可變性(Immutability)是函數式編程的核心思想之一,保證了程序運行中數據流的無損性。若是咱們忽略或者拋棄了狀態變化的歷史,那麼咱們很難去捕獲或者復現一些奇怪的小几率問題。使用不可變對象的優點在於你在程序的任何地方訪問任何的變量,你都只有只讀權限,也就意味着咱們不用再擔憂意外的非法修改的狀況。另外一方面,特別是在多線程編程中,每一個線程訪問的變量都是常量,所以能從根本上保證線程的安全性。總結而言,不可變對象可以幫助咱們構建簡單而更加安全的代碼。
在JavaScript中,咱們須要搞清楚const與不可變性之間的區別。const聲明的變量名會綁定到某個內存空間而不能夠被二次分配,其並無建立真正的不可變對象。你能夠不修改變量的指向,可是能夠修改該對象的某個屬性值,所以const建立的仍是可變對象。JavaScript中最方便的建立不可變對象的方法就是調用Object.freeze()函數,其能夠建立一層不可變對象:

const a = Object.freeze({
  foo: 'Hello',
  bar: 'world',
  baz: '!'
});

a.foo = 'Goodbye';
// Error: Cannot assign to read only property 'foo' of object Object

不過這種對象並非完全的不可變數據,譬如以下的對象就是可變的:

const a = Object.freeze({
  foo: { greeting: 'Hello' },
  bar: 'world',
  baz: '!'
});

a.foo.greeting = 'Goodbye';

console.log(`${ a.foo.greeting }, ${ a.bar }${a.baz}`);

如上所見,頂層的基礎類型屬性是不能夠改變的,不過若是對象類型的屬性,譬如數組等,仍然是能夠變化的。在不少函數式編程語言中,會提供特殊的不可變數據結構Trie Data Structures來實現真正的不可變數據結構,任何層次的屬性都不能夠被改變。Tries還能夠利用結構共享(Structural Sharing)的方式來在新舊對象之間共享未改變的對象屬性值,從而減小內存佔用而且顯著提高某些操做的性能。JavaScript中雖然語言自己並無提供給咱們這個特性,可是能夠經過Immutable.jsMori這些輔助庫來利用Tries的特性。我我的兩個庫都使用過,不過在大型項目中會更傾向於使用Immutable.js。估計到這邊,不少習慣了命令式編程的同窗都會大吼一句:在沒有變量的世界裏我又該如何編程呢?不要擔憂,如今咱們考慮下咱們什麼時候須要去修改變量值:譬如修改某個對象的屬性值,或者在循環中修改某個循環計數器的值。而函數式編程中與直接修改原變量值相對應的就是建立原值的一個副本而且將其修改以後賦予給變量。而對於另外一個常見的循環場景,譬如咱們所熟知的for,while,do,repeat這些關鍵字,咱們在函數式編程中可使用遞歸來實現本來的循環需求:

// 簡單的循環構造
var acc = 0;
for (var i = 1; i <= 10; ++i)
    acc += i;
console.log(acc); // prints 55
// 遞歸方式實現
function sumRange(start, end, acc) {
    if (start > end)
        return acc;
    return sumRange(start + 1, end, acc + start)
}
console.log(sumRange(1, 10, 0)); // prints 55

注意在遞歸中,與變量i相對應的便是start變量,每次將該值加1,而且將acc+start做爲當前和值傳遞給下一輪遞歸操做。在遞歸中,並無修改任何的舊的變量值,而是根據舊值計算出新值而且進行返回。不過若是真的讓你把全部的迭代所有轉變成遞歸寫法,估計得瘋掉,這個不可避免地會受到JavaScript語言自己的混亂性所影響,而且迭代式的思惟也不是那麼容易理解的。而在Elm這種專門面向函數式編程的語言中,語法會簡化不少:

sumRange start end acc =
    if start > end then
        acc
    else
        sumRange (start + 1) end (acc + start)

其每一次的迭代記錄以下:

sumRange 1 10 0 =      -- sumRange (1 + 1)  10 (0 + 1)
sumRange 2 10 1 =      -- sumRange (2 + 1)  10 (1 + 2)
sumRange 3 10 3 =      -- sumRange (3 + 1)  10 (3 + 3)
sumRange 4 10 6 =      -- sumRange (4 + 1)  10 (6 + 4)
sumRange 5 10 10 =     -- sumRange (5 + 1)  10 (10 + 5)
sumRange 6 10 15 =     -- sumRange (6 + 1)  10 (15 + 6)
sumRange 7 10 21 =     -- sumRange (7 + 1)  10 (21 + 7)
sumRange 8 10 28 =     -- sumRange (8 + 1)  10 (28 + 8)
sumRange 9 10 36 =     -- sumRange (9 + 1)  10 (36 + 9)
sumRange 10 10 45 =    -- sumRange (10 + 1) 10 (45 + 10)
sumRange 11 10 55 =    -- 11 > 10 => 55
55

高階函數

函數式編程傾向於重用一系列公共的純函數來處理數據,而面向對象編程則是將方法與數據封裝到對象內。這些被封裝起來的方法複用性不強,只能做用於某些類型的數據,每每只能處理所屬對象的實例這種數據類型。而函數式編程中,任何類型的數據則是被一視同仁,譬如map()函數容許開發者傳入函數參數,保證其可以做用於對象、字符串、數字,以及任何其餘類型。JavaScript中函數一樣是一等公民,即咱們能夠像其餘類型同樣處理函數,將其賦予變量、傳遞給其餘函數或者做爲函數返回值。而高階函數(Higher Order Function)則是可以接受函數做爲參數,可以返回某個函數做爲返回值的函數。高階函數常常用在以下場景:

  • 利用回調函數、Promise或者Monad來抽象或者隔離動做、做用以及任何的異步控制流

  • 構建可以做用於泛數據類型的工具函數

  • 函數重用或者建立柯里函數

  • 將輸入的多個函數而且返回這些函數複合而來的複合函數

典型的高階函數的應用就是複合函數,做爲開發者,咱們天性不但願一遍一遍地重複構建、測試與部分相同的代碼,咱們一直在尋找合適的只須要寫一遍代碼的方法以及如何將其重用於其餘模塊。代碼重用聽上去很是誘人,不過其在不少狀況下是難以實現的。若是你編寫過於偏向具體業務的代碼,那麼就會難以重用。而若是你把每一段代碼都編寫的過於泛化,那麼你就很難將這些代碼應用於具體的有業務場景,而須要編寫額外的鏈接代碼。而咱們真正追尋的就是在具體與泛化之間尋求一個平衡點,可以方便地編寫短小精悍而可複用的代碼片,而且可以將這些小的代碼片快速組合而解決複雜的功能需求。
在函數式編程中,函數就是咱們可以面向的最基礎代碼塊,而在函數式編程中,對於基礎塊的組合就是所謂的函數複合(Function Composition)。咱們以以下兩個簡單的JavaScript函數爲例:

var add10 = function(value) {
    return value + 10;
};
var mult5 = function(value) {
    return value * 5;
};

若是你習慣了使用ES6,那麼能夠用Arrow Function重構上述代碼:

var add10 = value => value + 10; 
var mult5 = value => value * 5;

如今看上去清爽多了吧,下面咱們考慮面對一個新的函數需求,咱們須要構建一個函數,首先將輸入參數加10而後乘以5,咱們能夠建立一個新函數以下:

var mult5AfterAdd10 = value => 5 * (value + 10)

儘管上面這個函數也很簡單,咱們仍是要避免任何函數都從零開始寫,這樣也會讓咱們作不少重複性的工做。咱們能夠基於上文的add10與mult5這兩個函數來構建新的函數:

var mult5AfterAdd10 = value => mult5(add10(value));

在mult5AfterAdd10函數中,咱們已經站在了add10與mult5這兩個函數的基礎上,不過咱們能夠用更優雅的方式來實現這個需求。在數學中,咱們認爲f ∘ g是所謂的Function Composition,所以`f ∘ g能夠認爲等價於f(g(x)),咱們一樣能夠基於這種思想重構上面的mult5AfterAdd10。不過JavaScript中並無原生的Function Composition支持,在Elm中咱們能夠用以下寫法:

add10 value =
    value + 10
mult5 value =
    value * 5
mult5AfterAdd10 value =
    (mult5 << add10) value

這裏的<<操做符也就指明瞭在Elm中是如何組合函數的,同時也較爲直觀的展現出了數據的流向。首先value會被賦予給add10,而後add10的結果會流向mult5。另外一個須要注意的是,(mult5 << add10)中的中括號是爲了保證函數組合會在函數調用以前。你也能夠組合更多的函數:

f x =
   (g << h << s << r << t) x

若是在JavaScript中,你可能須要以以下的遞歸調用來實現該功能:

g(h(s(r(t(x)))))
相關文章
相關標籤/搜索