迭代是訪問集合元素的一種方式。迭代器是一個能夠記住遍歷的位置的對象。迭代器對象從集合的第一個元素開始訪問,直到全部的元素被訪問完結束。迭代器只能往前不會後退。
python
咱們已經知道能夠對list、tuple、str等類型的數據使用for...in...
的循環語法從其中依次拿到數據進行使用,咱們把這樣的過程稱爲遍歷,也叫迭代
。
shell
可是,是否全部的數據類型均可以放到for...in...的語句中,而後讓for...in...每次從中取出一條數據供咱們使用,即供咱們迭代嗎?緩存
for i in 100: print(i) >>> TypeError: 'int' object is not iterable
以上咱們能夠看出,int整型不是iterable
,即int整型是不能夠迭代的
app
接下來,咱們自定義一個容器MyList用來存放數據,能夠經過add方法向其中添加數據函數
>>> class Mylist(object): def __init__(self): self.container = list() def add(self, item): self.container.append(item) >>> mylist = Mylist() >>> mylist.add(1) >>> mylist.add(2) >>> mylist.add(3) >>> for num in mylist: print(num) Traceback (most recent call last): File "<pyshell#13>", line 1, in <module> for num in mylist: TypeError: 'Mylist' object is not iterable # MyList容器的對象也是不能迭代的 >>>
咱們自定義了一個容器類型MyList,在將一個存放了多個數據的MyList對象放到for...in...
語句中,發現for...in...
並不能從中依次取出一條數據返回給咱們,也就是說咱們隨便封裝了一個能夠存放多條數據的類型並不能被迭代使用。
咱們把能夠經過for...in...這類語句迭代讀取一條數據供咱們使用的對象稱之爲可迭代對象(Iterable)
測試
可使用 isinstance()
判斷一個對象是不是 Iterable 對象:code
>>> from collections.abc import Iterable >>> isinstance([], Iterable) True >>> isinstance({}, Iterable) True >>> isinstance('abc', Iterable) True >>> isinstance(mylist, Iterable) False >>> isinstance(100, Iterable) False
咱們分析對可迭代對象進行迭代使用的過程,發現每迭代一次(即在for...in...中每循環一次)都會返回對象中的下一條數據,一直向後讀取數據直到迭代了全部數據後結束。那麼,在這個過程當中就應該有一個「人」去記錄每次訪問到了第幾條數據,以便每次迭代均可以返回下一條數據。咱們把這個能幫助咱們進行數據迭代的「人」稱爲迭代器
(Iterator)。
對象
可迭代對象的本質就是能夠向咱們提供一個這樣的中間「人」即迭代器
幫助咱們對其進行迭代遍歷使用。
內存
可迭代對象經過__iter__
方法向咱們提供一個迭代器,咱們在迭代一個可迭代對象的時候,實際上就是先獲取該對象提供的一個迭代器,而後經過這個迭代器來依次獲取對象中的每個數據.
ci
簡單來講,一個具有了__iter__
方法的對象,就是一個可迭代對象。
>>> class MyList(object): ... def __init__(self): ... self.container = [] ... def add(self, item): ... self.container.append(item) ... def __iter__(self): ... """返回一個迭代器""" ... # 咱們暫時忽略如何構造一個迭代器對象 ... pass ... >>> mylist = MyList() >>> from collections import Iterable >>> isinstance(mylist, Iterable) True >>> # 這回測試發現添加了__iter__方法的mylist對象已是一個可迭代對象了
list、tuple、str、set、dict都是可迭代對象,咱們能夠經過iter()函數獲取這些可迭代對象的迭代器。而後咱們能夠對獲取到的迭代器不斷使用next()
函數來獲取下一條數據。iter()函數實際上就是調用了可迭代對象的__iter__
方法。
>>> li = [11, 22, 33, 44, 55] >>> li_iter = iter(li) >>> next(li_iter) 11 >>> next(li_iter) 22 >>> next(li_iter) 33 >>> next(li_iter) 44 >>> next(li_iter) 55 >>> next(li_iter) Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration >>>
注意,當咱們已經迭代完最後一個數據以後,再次調用next()函數會拋出StopIteration
的異常,來告訴咱們全部數據都已迭代完成,不用再執行next()函數了。
可使用 isinstance()
判斷一個對象是不是 Iterator 對象
>>> from collections import Iterator >>> isinstance([], Iterator) False >>> isinstance(iter([]), Iterator) True >>> isinstance(iter("abc"), Iterator) True
經過上面的分析,咱們已經知道,迭代器是用來幫助咱們記錄每次迭代訪問到的位置,當咱們對迭代器使用next()
函數的時候,迭代器會向咱們返回它所記錄位置的下一個位置的數據。實際上,在使用next()函數的時候,調用的就是迭代器對象的__next__
方法(Python3中是對象的__next__方法,Python2中是對象的next()方法)。因此,咱們要想構造一個迭代器,就要實現它的__next__
方法。但這還不夠,python要求迭代器自己也是可迭代的,因此咱們還要爲迭代器實現__iter__
方法,而__iter__
方法要返回一個迭代器,迭代器自身正是一個迭代器,因此迭代器的__iter__
方法返回自身便可。
一個實現了__iter__方法和__next__方法的對象,就是迭代器。
class MyList(object): """自定義的一個可迭代對象""" def __init__(self): self.items = [] def add(self, val): self.items.append(val) def __iter__(self): myiterator = MyIterator(self) return myiterator class MyIterator(object): """自定義的供上面可迭代對象使用的一個迭代器""" def __init__(self, mylist): self.mylist = mylist # current用來記錄當前訪問到的位置 self.current = 0 def __next__(self): if self.current < len(self.mylist.items): item = self.mylist.items[self.current] self.current += 1 return item else: raise StopIteration def __iter__(self): return self if __name__ == '__main__': mylist = MyList() mylist.add(1) mylist.add(2) mylist.add(3) mylist.add(4) mylist.add(5) for num in mylist: print(num)
for item in Iterable 循環的本質就是先經過iter()函數獲取可迭代對象Iterable的迭代器,而後對獲取到的迭代器不斷調用next()方法來獲取下一個值並將其賦值給item,當遇到StopIteration的異常後循環結束。
咱們發現迭代器最核心的功能就是能夠經過next()
函數的調用來返回下一個數據值。若是每次返回的數據值不是在一個已有的數據集合中讀取的,而是經過程序按照必定的規律計算生成的,那麼也就意味着能夠不用再依賴一個已有的數據集合,也就是說不用再將全部要迭代的數據都一次性緩存下來供後續依次讀取,這樣能夠節省
大量的存儲(內存)空間。
舉個例子,好比,數學中有個著名的斐波拉契數列(Fibonacci),數列中第一個數爲0,第二個數爲1,其後的每個數均可由前兩個數相加獲得:
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, ...
如今咱們想要經過for...in...循環來遍歷迭代斐波那契數列中的前n個數。那麼這個斐波那契數列咱們就能夠用迭代器來實現,每次迭代都經過數學計算來生成下一個數。
class FibIterator(object): """斐波那契數列迭代器""" def __init__(self, n): """ :param n: int, 指明生成數列的前n個數 """ self.n = n # current用來保存當前生成到數列中的第幾個數了 self.current = 0 # num1用來保存前前一個數,初始值爲數列中的第一個數0 self.num1 = 0 # num2用來保存前一個數,初始值爲數列中的第二個數1 self.num2 = 1 def __next__(self): """被next()函數調用來獲取下一個數""" if self.current < self.n: num = self.num1 self.num1, self.num2 = self.num2, self.num1+self.num2 self.current += 1 return num else: raise StopIteration def __iter__(self): """迭代器的__iter__返回自身便可""" return self if __name__ == '__main__': fib = FibIterator(10) for num in fib: print(num, end=" ")
除了for循環能接收可迭代對象,list、tuple等也能接收。
li = list(FibIterator(15)) print(li) tp = tuple(FibIterator(6)) print(tp)
分析:list(),先生成一個空列表,調用可迭代對象,經過可迭代對象調用iter方法
生成迭代器,經過迭代器調用next方法
來獲取一條數據,直到產生StopIteration
異常,中止