python生成器與迭代器

  1. 生成器:

用列表生成式生成一個列表python

[ i*2  for  i  in  range(10) ]

python生成器與迭代器

這就是一個列表生成式。
列表生成式使得建立列表代碼變得簡潔。可是,若是一個列表很大,這樣建立就比較耗內存了。若是列表元素能夠按照某種算法推算出來,那咱們就能夠在循環過程當中不斷推算出後續的元素,這樣就不用建立一個完整的list。從而節省內存空間。在python中這種一邊循環一邊計算的機制,就稱爲生成器(generator)。算法

要建立一個generator,有不少方法,第一種方法很簡單,只須要把一個列表生成式的[]換成()就建立了一個generator。
先寫一個簡單的生成器ide

#!/usr/bin/env python
# -- coding:utf-8 --
# 列表生成式
import datetime
import time
starttime1 = datetime.datetime.now()
b = ( i*2 for i in  range(100000000) )
for i in b:
    print i
    time.sleep(1)
endtime1 = datetime.datetime.now()
print (endtime1 - starttime1).seconds

我起了一個1核1G的虛機,若是上述代碼採用列表去循環程序直接OOM被killed了。可是我若是採用上述代碼只會在程序啓動的時候內存使用率偏高,以後幾乎不多佔用內存,這很明顯就體現了生成器的優點。函數

generator很是強大。若是推算的算法比較複雜,還能夠用函數來實現。
下面就來用生成器實現一個斐波那契數列。
斐波那契數列:除了第一個和第二個數以外,任意一個數都是由前面兩個數相加獲得。在數學上,斐波納契數列以以下被以遞推的方法定義:F(1)=1,F(2)=1, F(n)=F(n-1)+F(n-2)(n>=3,n∈N*)
1,1,2,3,5,8...code

def fibo(n):
    a,b = 0,1
    while n > 0:
        print b
        a,b = b,a+b
        n -= 1 
fibo(10)

生成這樣一個數列直接用相似列表生成式的方式就比較麻煩了,上述函數變成生成器只須要將print變成yield就能夠了可是他將打印出來一個生成器而不是具體的數據,生成器是邊計算邊執行的它跟列表的不一樣之處就在於它只有一個next方法每一條數據都須要執行next方法才能獲得。對象

#!/usr/bin/env python
def fibo(n):
    a,b = 0,1
    while n > 0:
        #print b
        yield b
        a,b = b,a+b
        n -= 1 
print fibo(10)
f = fibo(10)
print f.next()

輸出結果卻跟上邊的代碼有所不一樣
python生成器與迭代器blog

這裏只打印了第一個元素,由於生成器是邊計算邊生成的,每調用一次next方法纔會由下一個值。要遍歷全部數據只要一個for循環便可:內存

#!/usr/bin/env python
def fibo(n):
    a,b = 0,1
    while n > 0:
        #print b
        yield b
        a,b = b,a+b
        n -= 1 
print fibo(10)
f = fibo(10)
for i in f:
    print i

這個yield關鍵字,改變了原有的函數執行流程,函數是順序執行,遇到return語句或者最後一行函數語句就返回。而變成generator的函數,在每次調用next()的時候執行,遇到yield語句返回,再次執行時從上次返回的yield語句處繼續執行。utf-8

2.迭代器:
能夠直接用於for循環的對象統稱爲可迭代對象:Iterable。
一類是集合數據類型,如list、tuple、dict、set、str等;
一類是generator,包括生成器和帶yield的generator function。
可使用isinstance()判斷一個對象是不是Iterable對象。get

>>> from collections import Iterable
>>> isinstance([],Iterable)
True
>>> 
>>> isinstance({},Iterable)
True
>>> isinstance('abc', Iterable)
True
>>> isinstance((x for x in range(10)), Iterable)
True
>>> isinstance(10, Iterable)
False
>>>

生成器不但能夠做用於for循環,還能夠被next()函數不斷調用並返回下一個值,直到最後拋出StopIteration錯誤表示沒法繼續返回下一個值了。

能夠被next()函數調用並不斷返回下一個值的對象稱爲迭代器:Iterator。

可使用isinstance()判斷一個對象是不是Iterator對象:

>>> from collections import Iterator
>>> 
>>> isinstance((x for x in range(10)),Iterator)
True
>>> isinstance([],Iterator)
False
>>> isinstance({},Iterator)
False
>>> isinstance('abc', Iterator)
False
>>>

生成器都是Iterator對象,但list、dict、str雖然是Iterable,卻不是Iterator。

把list、dict、str等Iterable變成Iterator可使用iter()函數:

>>> isinstance(iter([]), Iterator)
True
>>> isinstance(iter('abc'), Iterator)
True

爲何list、dict、str等數據類型不是Iterator?
這是由於Python的Iterator對象表示的是一個數據流,Iterator對象能夠被next()函數調用並不斷返回下一個數據,直到沒有數據時拋出StopIteration錯誤。能夠把這個數據流看作是一個有序序列,但咱們卻不能提早知道序列的長度,只能不斷經過next()函數實現按需計算下一個數據,因此Iterator的計算是惰性的,只有在須要返回下一個數據時它纔會計算。
參考連接:https://www.liaoxuefeng.com/wiki/1016959663602400/1017323698112640

相關文章
相關標籤/搜索