迭代器是 23 種設計模式中最經常使用的一種(之一),在 Python 中隨處可見它的身影,咱們常常用到它,可是卻不必定意識到它的存在。在關於迭代器的系列文章中(連接見文末),我至少提到了 23 種生成迭代器的方法。有些方法是專門用於生成迭代器的,還有一些方法則是爲了解決別的問題而「暗中」使用到迭代器。python
在系統學習迭代器以前,我一直覺得 range() 方法也是用於生成迭代器的,如今卻忽然發現,它生成的只是可迭代對象,而並非迭代器! (PS:Python2 中 range() 生成的是列表,本文基於Python3,生成的是可迭代對象)面試
因而,我有了這樣的疑問:爲何 range() 不生成迭代器呢?在查找答案的過程當中,我發現本身對 range 類型的認識存在一些誤區。所以,本文將和你們全面地認識一下 range ,期待與你共同窗習進步。設計模式
它的語法:range(start, stop [,step]) ;start 指的是計數起始值,默認是 0;stop 指的是計數結束值,但不包括 stop ;step 是步長,默認爲 1,不能夠爲 0 。range() 方法生成一段左閉右開的整數範圍。函數
>>> a = range(5) # 即 range(0,5) >>> a range(0, 5) >>> len(a) 5 >>> for x in a: >>> print(x,end=" ") 0 1 2 3 4
對於 range() 函數,有幾個注意點:(1)它表示的是左閉右開區間;(2)它接收的參數必須是整數,能夠是負數,但不能是浮點數等其它類型;(3)它是不可變的序列類型,能夠進行判斷元素、查找元素、切片等操做,但不能修改元素;(4)它是可迭代對象,卻不是迭代器。性能
# (1)左閉右開 >>> for i in range(3, 6): >>> print(i,end=" ") 3 4 5 # (2)參數類型 >>> for i in range(-8, -2, 2): >>> print(i,end=" ") -8 -6 -4 >>> range(2.2) ---------------------------- TypeError Traceback (most recent call last) ... TypeError: 'float' object cannot be interpreted as an integer # (3)序列操做 >>> b = range(1,10) >>> b[0] 1 >>> b[:-3] range(1, 7) >>> b[0] = 2 TypeError Traceback (most recent call last) ... TypeError: 'range' object does not support item assignment # (4)不是迭代器 >>> hasattr(range(3),'__iter__') True >>> hasattr(range(3),'__next__') False >>> hasattr(iter(range(3)),'__next__') True
能夠得到迭代器的內置方法不少,例如 zip() 、enumerate()、map()、filter() 和 reversed() 等等,可是像 range() 這樣僅僅獲得的是可迭代對象的方法就絕無僅有了(如有反例,歡迎告知)。這就是我存在知識誤區的地方。學習
在 for-循環 遍歷時,可迭代對象與迭代器的性能是同樣的,即它們都是惰性求值的,在空間複雜度與時間複雜度上並沒有差別。我曾歸納過二者的差異是「一同兩不一樣」:相同的是均可惰性迭代,不一樣的是可迭代對象不支持自遍歷(即next()方法),而迭代器自己不支持切片(即__getitem__()
方法)。設計
雖然有這些差異,但很可貴出結論說它們哪一個更優。如今微妙之處就在於,爲何給 5 種內置方法都設計了迭代器,恰恰給 range() 方法設計的就是可迭代對象呢?把它們都統一塊兒來,不是更好麼?3d
事實上,Pyhton 爲了規範性就幹過很多這種事,例如,Python2 中有 range() 和 xrange() 兩種方法,而 Python3 就幹掉了其中一種,還用了「李代桃僵」法。爲何不更規範點,令 range() 生成的是迭代器呢?code
關於這個問題,我沒找到官方解釋,如下純屬我的觀點 。對象
zip() 等方法都須要接收肯定的可迭代對象的參數,是對它們的一種再加工的過程,所以也但願立刻產出肯定的結果來,因此 Python 開發者就設計了這個結果是迭代器。這樣還有一個好處,即看成爲參數的可迭代對象發生變化的時候,做爲結果的迭代器由於是消耗型的,不會被錯誤地使用。
而 range() 方法就不一樣了,它接收的參數不是可迭代對象,自己是一種初次加工的過程,因此設計它爲可迭代對象,既能夠直接使用,也能夠用於其它再加工用途。例如,zip() 等方法就徹底能夠接收 range 類型的參數。
>>> for i in zip(range(1,6,2), range(2,7,2)): >>> print(i, end="") (1, 2)(3, 4)(5, 6)
也就是說,range() 方法做爲一種初級生產者,它生產的原料自己就有很大用途,早早把它變爲迭代器的話,無疑是一種多此一舉的行爲。
對於這種解讀,你是否以爲有道理呢?歡迎就這個話題與我探討。
以上是我對「爲何range()不產生迭代器」的一種解答。順着這個思路,我研究了一下它產生的 range 對象,一研究就發現,這個 range 對象也並不簡單。
首先奇怪的一點就是,它居然是不可變序列!我從未注意過這一點。雖說,我從未想過修改 range() 的值,但這一不可修改的特性仍是令我驚訝。
翻看文檔,官方是這樣明確劃分的——有三種基本的序列類型:列表、元組和範圍(range)對象。(There are three basic sequence types: lists, tuples, and range objects.)
這我倒一直沒注意,原來 range 類型竟然跟列表和元組是同樣地位的基礎序列!我一直記掛着字符串是不可變的序列類型,未曾想,這裏還有一位不可變的序列類型呢。
那 range 序列跟其它序列類型有什麼差別呢?
普通序列都支持的操做有 12 種,在《你真的知道Python的字符串是什麼嗎?》這篇文章裏提到過。range 序列只支持其中的 10 種,不支持進行加法拼接與乘法重複。
>>> range(2) + range(3) ----------------------------------------- TypeError Traceback (most recent call last) ... TypeError: unsupported operand type(s) for +: 'range' and 'range' >>> range(2)*2 ----------------------------------------- TypeError Traceback (most recent call last) ... TypeError: unsupported operand type(s) for *: 'range' and 'int'
那麼問題來了:一樣是不可變序列,爲何字符串和元組就支持上述兩種操做,而恰恰 range 序列不支持呢?雖然不能直接修改不可變序列,但咱們能夠將它們拷貝到新的序列上進行操做啊,爲什麼 range 對象連這都不支持呢?
且看官方文檔的解釋:
...due to the fact that range objects can only represent sequences that follow a strict pattern and repetition and concatenation will usually violate that pattern.
緣由是 range 對象僅僅表示一個遵循着嚴格模式的序列,而重複與拼接一般會破壞這種模式...
問題的關鍵就在於 range 序列的 pattern,仔細想一想,其實它表示的就是一個等差數列啊(喵,高中數學知識沒忘...),拼接兩個等差數列,或者重複拼接一個等差數列,想一想確實不妥,這就是爲啥 range 類型不支持這兩個操做的緣由了。由此推論,其它修改動做也會破壞等差數列結構,因此通通不給修改就是了。
回顧全文,我獲得了兩個偏冷門的結論:range 是可迭代對象而不是迭代器;range 對象是不可變的等差序列。
若單純看結論的話,你也許沒有感觸,或許還會說這沒啥了不起啊。但若是我追問,爲何 range 不是迭代器呢,爲何 range 是不可變序列呢?對這倆問題,你是否還能答出個自圓其說的設計思想呢?(PS:我決定了,如有機會面試別人,我必要問這兩個問題的嘿~)
因爲 range 對象這細微而有意思的特性,我以爲這篇文章寫得值了。本文是做爲迭代器系列文章的一篇來寫的,因此對於迭代器的基礎知識介紹很少,歡迎查看以前的文章。另外,還有一種特殊的迭代器也值得單獨成文,那就是生成器了,敬請期待後續推文哦~
猜你想讀:
官方文檔:http://t.cn/EGMzJt8
-----------------
本文原創並首發於公z號【Python貓】,後臺回覆「愛學習」,免費得到20+本精選電子書。