Python的 循環器 itertools

循環對象函數對象中,咱們瞭解了循環器(iterator)的功能。循環器是對象的容器,包含有多個對象。經過調用循環器的next()方法 (__next__()方法,在Python 3.x中),循環器將依次返回一個對象。直到全部的對象遍歷窮盡,循環器將舉出StopIteration錯誤。html

 

for i in iterator結構中,循環器每次返回的對象將賦予給i,直到循環結束。使用iter()內置函數,咱們能夠將諸如表、字典等容器變爲循環器。好比python

for i in iter([2, 4, 5, 6]):    
    print(i)

標準庫中的itertools包提供了更加靈活的生成循環器的工具。這些工具的輸入大都是已有的循環器。另外一方面,這些工具徹底能夠自行使用Python實現,該包只是提供了一種比較標準、高效的實現方式。這也符合Python「只有且最好只有解決方案」的理念。編程

# import the tools
from itertools import *

無窮循環器

count(5, 2)     #從5開始的整數循環器,每次增長2,即5, 7, 9, 11, 13, 15 ...
cycle('abc')    #重複序列的元素,既a, b, c, a, b, c ...
repeat(1.2)     #重複1.2,構成無窮循環器,即1.2, 1.2, 1.2, ...
 
repeat也能夠有一個次數限制:
repeat(10, 5)   #重複10,共重複5次

函數式工具

函數式編程是將函數自己做爲處理對象的編程範式。在Python中,函數也是對象,所以能夠輕鬆的進行一些函數式的處理,好比map(), filter(), reduce()函數。函數式編程

itertools包含相似的工具。這些函數接收函數做爲參數,並將結果返回爲一個循環器。函數

from itertools import *
rlt = imap(pow, [1, 2, 3], [1, 2, 3])
for num in rlt:    
    print(num)

imap()map()的區別在於,imap()能夠做用於無窮序列,而且,若是兩個序列的長度不一致,以短的那個爲準。工具

>>> for x in itertools.imap(lambda x, y: x * y, [10, 20, 30], itertools.count(0)):
...     print x
...
0
40
90



上面顯示了imap函數。該函數與map()函數功能類似,只不過返回的不是序列,而是一個循環器。包含元素1, 4, 27,即1**1, 2**2, 3**3的結果。函數pow(內置的乘方函數)做爲第一個參數。pow()依次做用於後面兩個列表的每一個元素,並收集函數結果,組成返回的循環器。spa

此外,還能夠用下面的函數:code

starmap(pow, [(1, 1), (2, 2), (3, 3)])orm

pow將依次做用於表的每一個tuple。htm


ifilter函數與filter()函數相似,只是返回的是一個循環器。

ifilter(lambda x: x > 5, [2, 3, 5, 6, 7]

將lambda函數依次做用於每一個元素,若是函數返回True,則收集原來的元素。6, 7

此外,

ifilterfalse(lambda x: x > 5, [2, 3, 5, 6, 7])

與上面相似,但收集返回False的元素。2, 3, 5

 

takewhile(lambda x: x < 5, [1, 3, 6, 7, 1])

當函數返回假時,不在迭代序列。1, 3

 

dropwhile(lambda x: x < 5, [1, 3, 6, 7, 1])

當函數返回假時, 開始迭代序列。6, 7, 1

組合工具

咱們能夠經過組合原有循環器,來得到新的循環器。

chain([1, 2, 3], [4, 5, 7])      # 鏈接兩個循環器成爲一個。1, 2, 3, 4, 5, 7

for i in chain(dropwhile(lambda s:s>2,[1,2,3,4,5]),takewhile(lambda s:s>3,[4,5,1,2,3,4,5])):
    print i
1
2
3
4
5
4
5


product([1,2], [1, 2])   # 多個循環器集合的笛卡爾積。至關於嵌套循環  

>>> for m, n in product([1,2], [1, 2]):   
...     print m,n
... 
1 1
1 2
2 1
2 2

permutations('abc', 2)   # 從'abcd'中挑選兩個元素,好比ab, bc, ... 將全部結果排序,返回爲新的循環器。

注意,上面的組合分順序,即ab, ba都返回。

>>> for i in permutations('abc', 2) :
...     print i
... 
('a', 'b')
('a', 'c')
('b', 'a')
('b', 'c')
('c', 'a')
('c', 'b')

combinations('abc', 2)   # 從'abcd'中挑選兩個元素,好比ab, bc, ... 將全部結果排序,返回爲新的循環器。

注意,上面的組合不分順序,即ab, ba的話,只返回一個ab。

 

>>> for i in combinations('abc', 2) :
...     print i
... 
('a', 'b')
('a', 'c')
('b', 'c')

combinations_with_replacement('abc', 2) # 與上面相似,但容許兩次選出的元素重複。即多了aa, bb, cc

groupby()

將key函數做用於原循環器的各個元素。根據key函數結果,將擁有相同函數結果的元素分到一個新的循環器。每一個新的循環器以函數返回結果爲標籤。

這就好像一羣人的身高做爲循環器。咱們能夠使用這樣一個key函數: 若是身高大於180,返回"tall";若是身高底於160,返回"short";中間的返回"middle"。最終,全部身高將分爲三個循環器,即"tall", "short", "middle"。


>>> def height_class(h):
...     if h > 180:
...         return "tall"
...     elif h < 160:
...         return "short"
...     else:
...         return "middle"
... 
>>> friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]
>>> friends = sorted(friends, key = height_class)
>>> friends 
[165, 170, 177, 158, 159, 191, 181, 182, 190]
>>> for m, n in groupby(friends, key = height_class):
...     print(m)
...     print(list(n))
... 
middle
[165, 170, 177]
short
[158, 159]
tall
[191, 181, 182, 190]

注意,groupby的功能相似於UNIX中的uniq命令。分組以前須要使用sorted()對原循環器的元素,根據key函數進行排序,讓同組元素先在位置上靠攏。

看下面沒有排序的錯誤結果
friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]
>>> for m, n in groupby(friends, key = height_class):
...     print(m)
...     print(list(n))
... 
tall
[191]
short
[158, 159]
middle
[165, 170, 177]
tall
[181, 182, 190]

其它工具

compress('ABCD', [1, 1, 1, 0])  # 根據[1, 1, 1, 0]的真假值狀況,選擇第一個參數'ABCD'中的元素。A, B, C

islice()                        # 相似於slice()函數,只是返回的是一個循環器

izip()                          # 相似於zip()函數,只是返回的是一個循環器。

總結

itertools的工具均可以自行實現。itertools只是提供了更加成形的解決方案。

相關文章
相關標籤/搜索