Python 高級編程:徹底理解生成器

生成器是 Python 初級開發者最難理解的概念之一,雖被認爲是 Python 編程中的高級技能,但在各類項目中能夠隨處見到生成器的身影,你得不得去理解它、使用它、甚至愛上它。javascript

提到生成器,總不可避免地要把迭代器拉出來對比着講,生成器就是一個在行爲上和迭代器很是相似的對象,若是把迭代器比做 Android 系統,那麼生成器就是 iOS,兩者功能上差很少,可是生成器更優雅。html

什麼是迭代器

顧名思義,迭代器就是用於迭代操做(for 循環)的對象,它像列表同樣能夠迭代獲取其中的每個元素,任何實現了 __next__ 方法
(python2 是 next)的對象均可以稱爲迭代器。java

它與列表的區別在於,構建迭代器的時候,不像列表把全部元素一次性加載到內存,而是以一種延遲計算(lazy evaluation)方式返回元素,這正是它的優勢。好比列表含有中一千萬個整數,須要佔超過400M的內存,而迭代器只須要幾十個字節的空間。由於它並無把全部元素裝載到內存中,而是等到調用 next 方法時候才返回該元素(按需調用 call by need 的方式,本質上 for 循環就是不斷地調用迭代器的next方法)。python

以斐波那契數列爲例來實現一個迭代器:編程

class Fib:
    def __init__(self, n):
        self.prev = 0
        self.cur = 1
        self.n = n

    def __iter__(self):
        return self

    def __next__(self):
        if self.n > 0:
            value = self.cur
            self.cur = self.cur + self.prev
            self.prev = value
            self.n -= 1
            return value
        else:
            raise StopIteration()
      # 兼容python2
      def __next__(self):
          return self.next()

f = Fib(10)
print([i for i in f])
#[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]複製代碼

什麼是生成器

知道迭代器以後,就能夠正式進入生成器的話題了。普通函數用 return 返回一個值,和 Java 等其餘語言是同樣的,然而在 Python 中還有一種函數,用關鍵字 yield 來返回值,這種函數叫生成器函數,函數被調用時會返回一個生成器對象,生成器本質上仍是一個迭代器,也是用在迭代操做中,所以它有和迭代器同樣的特性,惟一的區別在於實現方式上不同,後者更加簡潔函數

最簡單的生成器函數:性能

>>> def func(n):
...     yield n*2
...
>>> func
<function func at 0x00000000029F6EB8>
>>> g = func(5)
>>> g
<generator object func at 0x0000000002908630>
>>>複製代碼

func 就是一個生成器函數,調用該函數時返回對象就是生成器 g ,這個生成器對象的行爲和迭代器是很是類似的,能夠用在 for 循環等場景中。注意 yield 對應的值在函數被調用時不會馬上返回,而是調用next方法時(本質上 for 循環也是調用 next 方法)才返回lua

>>> g = func(5)
>>> next(g)
10

>>> g = func(5)
>>> for i in g:
...     print(i)
...
10複製代碼

那爲何要用生成器呢?顯然,用生成器在逼格上要比迭代器高几個等級,它沒有那麼多冗長代碼了,並且性能上同樣的高效,爲何不用呢?來看看用生成器實現斐波那契數列有多簡單。spa

def fib(n):
    prev, curr = 0, 1
    while n > 0:
        n -= 1
        yield curr
        prev, curr = curr, curr + prev

print([i for i in fib(10)])
#[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]複製代碼

生成器表達式

在前面一期「這樣寫代碼更優雅」的文章裏面曾經介紹過列表推導式(list comprehension),生成器表達式與列表推導式長的很是像,可是它倆返回的對象不同,前者返回生成器對象,後者返回列表對象。.net

>>> g = (x*2 for x in range(10))
>>> type(g)
<type 'generator'>
>>> l = [x*2 for x in range(10)]
>>> type(l)
<type 'list'>複製代碼

前面已經介紹過生成器的優點,就是迭代海量數據時,顯然生成器更合適。

>

同步發表於:foofish.net/what-is-pyt…
公衆號 Python之禪 (id:VTtalk),分享 Python 等技術乾貨

Python之禪
相關文章
相關標籤/搜索