在Python中迭代序列(或者其餘可迭代對象)時,有一些函數很是好用。有些函數位於itertools模塊中,還有一些Python的內建函數也十分方便。python
程序能夠同時迭代兩個序列。好比有下面兩個列表:函數
names = ['anne', 'beth', 'george', 'damon'] ages = [12, 45, 32, 102]
若是想要打印名字和對應的年齡,能夠像下面這樣作:spa
In [7]: for i in range(len(names)): ...: print(names[i], 'is', ages[i], 'years old') ...: anne is 12 years old beth is 45 years old george is 32 years old damon is 102 years old
這裏 i 是循環索引的標準變量名。code
而內建的zip函數就能夠用來進行並行迭代,能夠把兩個序列 「壓縮」 在一塊兒,而後返回一個元組的列表:對象
>>> zip(names, ages) [('anne', 12), ('beth', 45), ('george', 32), ('damon', 102)]
如今我能夠在循環中解包元組:blog
In [9]: for name, age in zip(names, ages): ...: print(name, 'is', age, 'years old') ...: anne is 12 years old beth is 45 years old george is 32 years old damon is 102 years old
zip 函數也能夠做用於任意多的序列。關於它很重要的一點是zip能夠處理不等長的序列,當最短的序列 「用完」 的時候就會中止:排序
>>> zip(range(5), xrange(1000000000)) [(0, 0), (1, 1), (2, 2), (3, 3), (4, 4)]
在上面的代碼中,不推薦用range替換xrange——儘管只須要要前5個數字,但range會計算全部的數字,這裏要花費很長的時間。而使用xrange就沒有這個問題,它只計算前5個數字。索引
有些時間想要迭代訪問序列中的對象,同時還有獲取當前對象的索引。例如,在一個字符串列表中替換全部包含'xxx'的子字符串。實現的方法確定有不少,假設你想象下面這樣作:ip
for string in strings: if 'xxx' in string: index = strings.index(string) # Search for the string in the list of strings strings[index] = '[censored]'
沒問題,可是在替換前要搜索給定的字符串彷佛不必。若是不替換的話,搜索還會返回錯誤的索引(前面出現的同一個詞的索引)。一個比較好的版本以下:內存
index = 0 for string in strings: if 'xxx' in string: strings[index] = '[censored]' index += 1
方法有些笨,不過還能夠接受。另外一種方法是使用內建的enumerate函數:
for index, string in enumerate(strings): if 'xxx' in string: strings[index] = '[censored]'
這個函數能夠在提供索引的地方迭代索引-值對
3. 翻轉和排序迭代
讓咱們看看另外兩個有用的函數:reversed和sorted。它們同列表的reverse和sort(sorted和sort使用一樣的參數)方法相似,但做用於任何序列或可迭代對象上,不是原地修改對象,而是返回翻轉或排序後的版本:
>>> sorted([4, 3, 6, 8, 3]) [3, 3, 4, 6, 8] >>> sorted('Hello, world!') [' ', '!', ',', 'H', 'd', 'e', 'l', 'l', 'l', 'o', 'o', 'r', 'w'] >>> list(reversed('Hello, world!')) ['!', 'd', 'l', 'r', 'o', 'w', ' ', ',', 'o', 'l', 'l', 'e', 'H'] >>> ''.join(reversed('Hello, world!')) '!dlrow ,olleH'
注意,雖然sorted方法返回列表,reversed方法卻返回一個更加難以想象的可迭代對象。它們具體的含義不用過多關注,大可在for循環以及join方法中使用,而不會有任何問題。不過卻不能直接對它使用索引、分片以及調用list方法,若是但願進行上述處理,那麼可使用list類型轉換返回的對象,上面的例子中已經給出具體的作法。
4. 迭代器規則
迭代的意思是重複作一些事不少次,就像在循環中作的那樣。到如今爲止只在for循環中對序列和字典進行過迭代,但實際上也能對其餘對象進行迭代:只要改對象實現了__iter__方法。
__iter__方法會返回一個迭代器(iterator),所謂的迭代器就是具備next方法(這個方法在調用時不須要任何參數)的對象。在調用next方法時,迭代器會返回它的下一個值。若是next方法被調用,但迭代器沒有值能夠返回,就會引起一個StopIteration異常。
注意 迭代器規則在Python 3.0中有一些變化。在新的規則中,迭代器對象應該實現__next__方法,而不是next。而新的內建函數next能夠用於訪問這個方法。換句話說,next(it)等同於3.0以前版本中的it.next()。
迭代規則的關鍵是什麼?爲何不使用列表?由於列表的殺傷力太大。若是一個函數,能夠一個接一個地計算值,那麼在使用時多是計算一個值時獲取一個值——而不是經過列表一次性獲取全部值。若是有不少值,列表就會佔用太多的內存。但還有其餘的理由:使用迭代器更通用、更簡單、更優雅。讓咱們看看一個不使用列表的例子,由於要用的話,列表的長度必須無限。
這裏的「列表」是一個斐波那契數列。使用的迭代器以下:
In [1]: class Fibs: ...: def __init__(self): ...: self.a = 0 ...: self.b = 1 ...: def next(self): ...: self.a, self.b = self.b, self.a + self.b ...: return self.a ...: def __iter__(self): ...: return self
注意,迭代器實現了__iter__方法,這個方法實際上返回迭代器自己。在不少狀況下,__iter__會放到其餘的會在for循環中使用的對象中。這樣一來,程序就能返回所需的迭代器。此外,推薦使用迭代器實現它本身的__iter__方法,而後就能直接在for循環中使用迭代器自己了。
注意 正式的說法是,一個實現了__iter__方法的對象是可迭代的,一個實現了next方法的對象則是迭代器。
首先,產生一個Fibs對象:
In [2]: fibs = Fibs()
可在for循環中使用該對象——好比去查找在斐波那契數列中比1000大的數中的最小的數:
In [3]: for f in fibs: ...: if f > 1000: ...: print f ...: break 1597
由於設置了break,因此循環在這裏中止了,不然循環會一直繼續下去。
提示 內建函數iter能夠從可迭代的對象中得到迭代器。
>>> it = iter([1, 2, 3]) >>> it.next() 1 >>> it.next() 2
除此以外,它也能夠從函數或者其餘可調用對象中獲取可迭代對象。
5. 從迭代器獲得序列
除了在迭代器和可迭代對象上進行迭代外,還能把它們轉換爲序列。在大部分能使用序列的狀況下(除了或者分片等操做中),都能使用迭代器(或者可迭代對象)替換。關於這個的一個頗有用的例子是使用list構造方法顯示地將迭代器轉化爲列表。
>>> class TestIterator: ... value = 0 ... def next(self): ... self.value += 1 ... if self.value > 10: ... raise StopIteration ... return self.value ... def __iter__(self): ... return self ... >>> ti = TestIterator() >>> list(ti) [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]