生成器-generator

時間 2019-11-15

標籤成器 generator 简体版

原文原文鏈接

您可能據說過，帶有 yield 的函數在 Python 中被稱之爲 generator（生成器），何謂 generator ？html

咱們先拋開 generator，以一個常見的編程題目來展現 yield 的概念。node

如何產生斐波拉契數列?python

斐波那契數列（Fibonacci sequence），又稱黃金分割數列、因數學家列昂納多·斐波那契（Leonardoda Fibonacci）以兔子繁殖爲例子而引入，故又稱爲「兔子數列」，指的是這樣一個數列：一、一、二、三、五、八、1三、2一、3四、……在數學上，斐波納契數列以以下被以遞歸的方法定義：F(0)=1，F(1)=1, F(n)=F(n-1)+F(n-2)（n>=2，n∈N*）
程序員

許多初學者均可以寫出下面的函數：編程

方法一：數據結構

1 # 生成斐波那契數列前n個元素
2 def fab(n): 3     i = 0 4     a, b = 0, 1
5     while i < n: 6         print(a) 7         a, b = b, a + b 8         i += 1

執行 fab(6) 得出前6個元素：app

結果沒有問題，但函數的返回值爲None，別的函數沒法獲取結果，複用性不好，函數

要提升 fab 函數的可複用性，最好不要直接打印出數列，而是返回一個 List。如下是 fab 函數改寫後的第二個版本：spa

方法二：code

 1 # 生成斐波那契數列前n個元素,以list返回
 2 def fab(n):  3     i = 0  4     a, b = 0, 1
 5     list_fab = []  6     while i < n:  7         # print(a)
 8  list_fab.append(a)  9         a, b = b, a + b 10         i += 1
11 
12     return list_fab

可使用以下方式打印出 fab 函數返回的 List：

1 for item in fab(6): 2     print(item)

改寫後的 fab 函數經過返回 List 能知足複用性的要求，可是更有經驗的開發者會指出，該函數在運行中佔用的內存會隨着參數 n的增大而增大，若是要控制內存佔用，最好不要用 List，來保存中間結果，而該經過 iterable 對象來迭代，這時yield就派上用場了。

第三個版本的 fab 和初版相比，僅僅把 print b 改成了 yield b，就在保持簡潔性的同時得到了 iterable 的效果。

方法三：

1 # 使用 yield替代print
2 def fab(n): 3     i = 0 4     a, b = 0, 1
5     while i < n: 6         # print(a)
7         yield a 8         a, b = b, a + b 9         i += 1

簡單地講，yield 的做用就是把一個函數變成一個 generator，帶有 yield 的函數再也不是一個普通函數，Python 解釋器會將其視爲一個 generator，調用 fab(6) 不會執行 fab 函數，而是返回一個 iterable 對象！在 for 循環執行時，每次循環都會執行 fab 函數內部的代碼，執行到 yield a 時，fab 函數就返回一個迭代值，下次迭代時，代碼從 yield a 的下一條語句繼續執行，而函數的本地變量看起來和上次中斷執行前是徹底同樣的，因而函數繼續執行，直到再次遇到 yield。

for item in fab(6): print(item)

也能夠手動調用 fab(6) 的 next() 方法（由於 fab(6) 是一個 generator 對象，該對象具備 next() 方法），這樣咱們就能夠更清楚地看到 fab 的執行流程：

1 f = fab(6) 2 print(next(f)) 3 print(next(f)) 4 print(next(f)) 5 print(next(f)) 6 print(next(f)) 7 print(next(f)) 8 print(next(f))

當函數執行結束時，generator 自動拋出 StopIteration 異常，表示迭代完成。在 for 循環裏，無需處理 StopIteration 異常，循環會正常結束。

咱們能夠得出如下結論：

一個帶有 yield 的函數就是一個 generator，它和普通函數不一樣，生成一個 generator 看起來像函數調用，但不會執行任何函數代碼，直到對其調用 next()（在 for 循環中會自動調用 next()）纔開始執行。雖然執行流程仍按函數的流程執行，但每執行到一個 yield 語句就會中斷，並返回一個迭代值，下次執行時從 yield 的下一個語句繼續執行。看起來就好像一個函數在正常執行的過程當中被 yield 中斷了數次，每次中斷都會經過 yield 返回當前的迭代值。

若是想實現一個自定義方法，與range()相似，咱們能夠用生成器來定義它，下面是一個生成範圍內浮點數的生成器：

1 def f_range(start, stop, step):
2     f = start
3     while f < stop:
4         yield f
5         f += step

使用這個函數，咱們能夠用for循環迭代它：

1 for item in f_range(0, 4, 0.5):
2     print(item)

或者使用其餘接受可迭代對象的方法(內置函數 def sum(iterable, start=None): , list(iterable) )：

1 print("sum:", sum(f_range(0, 4, 0.5)))
2 print("list:", list(f_range(0, 4, 0.5)))

探討：

一個函數中須要有一個yield 語句便可將其轉換爲一個生成器。跟普通函數不一樣
的是，生成器只能用於迭代操做。

跟普通函數不一樣的是，生成器只能用於迭代操做。下面是一個實驗，向你展現這樣的函數底層工做機

制：

 1 >>> def countdown(n):
 2 ...     while n > 0 :
 3 ...         print("before yield")
 4 ...         yield n
 5 ...         print("after yield")
 6 ...         n -= 1
 7 ...         
 8 >>> iter_c  = countdown(3)  # Create the generator, notice no output appears
 9 >>> print(iter_c, type(iter_c))
10 <generator object countdown at 0x033D0198> <class 'generator'>
11 >>> next(iter_c)  # Run to first yield and emit a value, but doesn't print "after yield"
12 before yield
13 3
14 >>> next(iter_c)  # Run to next yield
15 after yield
16 before yield
17 2
18 >>> next(iter_c)  # Run to next yield
19 after yield
20 before yield
21 1
22 >>> next(iter_c)  # Run to next yield (iteration stops)
23 after yield
24 Traceback (most recent call last):
25   File "<input>", line 1, in <module>
26 StopIteration

一個生成器函數主要特徵是它只會迴應在迭代中使用到的next 操做。一旦生成器
函數返回退出，迭代終止。咱們在迭代中一般使用的for 語句會自動處理這些細節，所
以你無需擔憂。

反向迭代：

不少程序員並不知道能夠經過在自定義類上實現reversed () 方法來實現反向迭代。好比：

 1 class CountDown(object):
 2     def __init__(self, start):
 3         self.__start = start
 4 
 5     def __iter__(self):  # Forward iterator
 6         n = self.__start
 7         while n >= 0:
 8             yield n
 9             n -= 1
10 
11     def __reversed__(self):  # Reverse iterator
12         n = 0
13         while n <= self.__start:
14             yield n
15             n += 1
16 
17 c1 = CountDown(5)
18 for item in c1:
19     print(item)
20 
21 for item in reversed(CountDown(5)):
22     print(item)

定義一個反向迭代器可使得代碼很是的高效，由於它再也不須要將數據填充到一個
列表中而後再去反向迭代這個列表。

在迭代器一文中咱們使用Node類表示樹形數據結構，咱們要實現深度優先方式遍歷樹的節點的方法，下面是示例代碼：

 1 class Node(object):
 2     def __init__(self, value):
 3         self.__value = value
 4         self.__children = []
 5 
 6     def add_child(self, node):
 7         self.__children.append(node)
 8 
 9     def set_value(self, value):
10         self.__value = value
11 
12     def get_value(self):
13         return self.__value
14 
15     def __repr__(self):
16         return 'Node({v})'.format(v = self.__value)
17 
18     def __iter__(self):
19         return iter(self.__children)
20 
21     def depth_first(self):
22         yield self
23         for child in self:  # Invokes self.__iter__()
24             yield from child.depth_first()  # 將yield from視爲提供了一個調用者和子生成器之間的透明的雙向通道。包括從子生成器獲取數據以及向子生成器傳送數據。

# Example
root = Node(10)
n2 = Node(20)
n3 = Node(30)

root.add_child(n2)
root.add_child(n3)
n2.add_child(Node(40))
n2.add_child((Node(50)))
n3.add_child((Node(60)))

for chi in root.depth_first():
    print(chi)

先序遍歷過程：

因此最後的輸出是：Node(10) Node(20) Node(40) Node(50) Node(30) Node(60)

迭代器切片：

函數itertools.islice() 正好適用於在迭代器和生成器上作切片操做

def count(n):
    while True:
        yield n
        n += 1

it_c = count(0)
it_c[10, 20]

#Output:
#it_c[10, 20]
#TypeError: 'generator' object is not subscriptable

#Use islice
from itertools import islice
for i in islice(count(1), 10, 20):
    print(i)