要理解「函數自己也能夠做爲參數傳入」,能夠從Python內建的map/reduce函數入手。html
若是你讀過Google的那篇大名鼎鼎的論文「MapReduce: Simplified Data Processing on Large Clusters」,你就能大概明白map/reduce的概念。算法
咱們先看map。map()
函數接收兩個參數,一個是函數,一個是序列,map
將傳入的函數依次做用到序列的每一個元素,並把結果做爲新的list返回。編程
舉例說明,好比咱們有一個函數f(x)=x2,要把這個函數做用在一個list [1, 2, 3, 4, 5, 6, 7, 8, 9]
上,就能夠用map()
實現以下:閉包
如今,咱們用Python代碼實現:app
>>> def f(x): ... return x * x ... >>> map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9]) [1, 4, 9, 16, 25, 36, 49, 64, 81]
請注意咱們定義的函數f
。當咱們寫f
時,指的是函數對象自己,當咱們寫f(1)
時,指的是調用f函數,並傳入參數1,期待返回結果1。函數式編程
所以,map()
傳入的第一個參數是f
,即函數對象自己。函數
像map()
函數這種可以接收函數做爲參數的函數,稱之爲高階函數(Higher-order function)。google
你可能會想,不須要map()
函數,寫一個循環,也能夠計算出結果:code
L = [] for n in [1, 2, 3, 4, 5, 6, 7, 8, 9]: L.append(f(n)) print L
的確能夠,可是,從上面的循環代碼,能一眼看明白「把f(x)做用在list的每個元素並把結果生成一個新的list」嗎?htm
因此,map()
做爲高階函數,事實上它把運算規則抽象了,所以,咱們不但能夠計算簡單的f(x)=x2,還能夠計算任意複雜的函數。
再看reduce的用法。reduce把一個函數做用在一個序列[x1, x2, x3...]上,這個函數必須接收兩個參數,reduce把結果繼續和序列的下一個元素作累積計算,其效果就是:
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
比方說對一個序列求和,就能夠用reduce實現:
>>> def add(x, y): ... return x + y ... >>> reduce(add, [1, 3, 5, 7, 9]) 25
固然求和運算能夠直接用Python內建函數sum()
,不必動用reduce。
可是若是要把序列[1, 3, 5, 7, 9]
變換成整數13579,reduce就能夠派上用場:
>>> def fn(x, y): ... return x * 10 + y ... >>> reduce(fn, [1, 3, 5, 7, 9]) 13579
這個例子自己沒多大用處,可是,若是考慮到字符串str
也是一個序列,對上面的例子稍加改動,配合map()
,咱們就能夠寫出把str
轉換爲int
的函數:
>>> def fn(x, y): ... return x * 10 + y ... >>> def char2num(s): ... return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s] ... >>> reduce(fn, map(char2num, '13579')) 13579
整理成一個str2int
的函數就是:
def str2int(s): def fn(x, y): return x * 10 + y def char2num(s): return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s] return reduce(fn, map(char2num, s))
還能夠用lambda函數進一步簡化成:
def char2num(s): return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s] def str2int(s): return reduce(lambda x,y: x*10+y, map(char2num, s))
也就是說,假設Python沒有提供int()
函數,你徹底能夠本身寫一個把字符串轉化爲整數的函數,並且只須要幾行代碼!
lambda函數的用法在下一節介紹。
排序也是在程序中常常用到的算法。不管使用冒泡排序仍是快速排序,排序的核心是比較兩個元素的大小。若是是數字,咱們能夠直接比較,但若是是字符串或者兩個dict呢?直接比較數學上的大小是沒有意義的,所以,比較的過程必須經過函數抽象出來。一般規定,對於兩個元素x
和y
,若是認爲x < y
,則返回-1
,若是認爲x == y
,則返回0
,若是認爲x > y
,則返回1
,這樣,排序算法就不用關心具體的比較過程,而是根據比較結果直接排序。
Python內置的sorted()
函數就能夠對list進行排序:
>>> sorted([36, 5, 12, 9, 21]) [5, 9, 12, 21, 36]
此外,sorted()
函數也是一個高階函數,它還能夠接收一個比較函數來實現自定義的排序。好比,若是要倒序排序,咱們就能夠自定義一個reversed_cmp
函數:
def reversed_cmp(x, y): if x > y: return -1 if x < y: return 1 return 0
傳入自定義的比較函數reversed_cmp
,就能夠實現倒序排序:
>>> sorted([36, 5, 12, 9, 21], reversed_cmp) [36, 21, 12, 9, 5]
咱們再看一個字符串排序的例子:
>>> sorted(['about', 'bob', 'Zoo', 'Credit']) ['Credit', 'Zoo', 'about', 'bob']
默認狀況下,對字符串排序,是按照ASCII的大小比較的,因爲'Z' < 'a'
,結果,大寫字母Z
會排在小寫字母a
的前面。
如今,咱們提出排序應該忽略大小寫,按照字母序排序。要實現這個算法,沒必要對現有代碼大加改動,只要咱們能定義出忽略大小寫的比較算法就能夠:
def cmp_ignore_case(s1, s2): u1 = s1.upper() u2 = s2.upper() if u1 < u2: return -1 if u1 > u2: return 1 return 0
忽略大小寫來比較兩個字符串,實際上就是先把字符串都變成大寫(或者都變成小寫),再比較。
這樣,咱們給sorted
傳入上述比較函數,便可實現忽略大小寫的排序:
>>> sorted(['about', 'bob', 'Zoo', 'Credit'], cmp_ignore_case) ['about', 'bob', 'Credit', 'Zoo']
從上述例子能夠看出,高階函數的抽象能力是很是強大的,並且,核心代碼能夠保持得很是簡潔。
高階函數除了能夠接受函數做爲參數外,還能夠把函數做爲結果值返回。
咱們來實現一個可變參數的求和。一般狀況下,求和的函數是這樣定義的:
def calc_sum(*args): ax = 0 for n in args: ax = ax + n return ax
可是,若是不須要馬上求和,而是在後面的代碼中,根據須要再計算怎麼辦?能夠不返回求和的結果,而是返回求和的函數!
def lazy_sum(*args): def sum(): ax = 0 for n in args: ax = ax + n return ax return sum
當咱們調用lazy_sum()
時,返回的並非求和結果,而是求和函數:
>>> f = lazy_sum(1, 3, 5, 7, 9) >>> f <function sum at 0x10452f668>
調用函數f
時,才真正計算求和的結果:
>>> f() 25
在這個例子中,咱們在函數lazy_sum
中又定義了函數sum
,而且,內部函數sum
能夠引用外部函數lazy_sum
的參數和局部變量,當lazy_sum
返回函數sum
時,相關參數和變量都保存在返回的函數中,這種稱爲「閉包(Closure)」的程序結構擁有極大的威力。
請再注意一點,當咱們調用lazy_sum()
時,每次調用都會返回一個新的函數,即便傳入相同的參數:
>>> f1 = lazy_sum(1, 3, 5, 7, 9) >>> f2 = lazy_sum(1, 3, 5, 7, 9) >>> f1==f2 False
f1()
和f2()
的調用結果互不影響。
把函數做爲參數傳入,或者把函數做爲返回值返回,這樣的函數稱爲高階函數,函數式編程就是指這種高度抽象的編程範式。
假設Python沒有提供map()
函數,請自行編寫一個my_map()
函數實現與map()
相同的功能。
Python提供的sum()
函數能夠接受一個list並求和,請編寫一個prod()
函數,能夠接受一個list並利用reduce()
求積。