「語法糖」,從字面上看應該是一種語法。「糖」,能夠理解爲簡單、簡潔。其實咱們也已經意識到,沒有這些被稱爲「語法糖」的語法,咱們也能實現相應的功能,而 「語法糖」使咱們能夠更加簡潔、快速的實現這些功能。 只是Python解釋器會把這些特定格式的語法翻譯成本來那樣複雜的代碼邏輯而已,沒有什麼過高深的東西。html
到目前爲止,咱們使用和介紹過的語法糖有:算法
這裏會再介紹兩個:app
顧名思義,列表生成式就是一個用來生成列表的特定語法形式的表達式。函數
[exp for iter_var in iterable]
工做過程:翻譯
至關於這樣的過程:code
L = [] for iter_var in iterable: L.append(exp)
[exp for iter_var in iterable if_exp]
工做過程:htm
至關於這樣的過程:對象
L = [] for iter_var in iterable: if_exp: L.append(exp)
[exp for iter_var_A in iterable_A for iter_var_B in iterable_B]
工做過程:
每迭代iterable_A中的一個元素,就把ierable_B中的全部元素都迭代一遍。blog
至關於這樣的過程:內存
L = [] for iter_var_A in iterable_A: for iter_var_B in iterable_B: L.append(exp)
其實列表生成式也是Python中的一種「語法糖」,也就是說列表生成式應該是Python提供的一種生成列表的簡潔形式,應用列表生成式能夠快速生成一個新的list。它最主要的應用場景是:根據已存在的可迭代對象推導出一個新的list。
咱們能夠對幾個生成列表的要求分別經過「不使用列表生成式」和「使用列表生成式」來實現,而後作個對比總結。
# 不使用列表生成式實現 list1 = list(range(3, 11)) # 使用列表生成式實現 list2 = [x for x in range(3, 11)]
# 不使用列表生成式實現 list3 = [] for n in range(3, 11): list3.append(2*n + 1) # 使用列表生成式實現 list4 = [2*n + 1 for n in range(3, 11)]
L = [3, 7, 11, 14,19, 33, 26, 57, 99] # 不使用列表生成式實現 list5 = [] for x in L: if x < 20: list5.append(x) # 使用列表生成式實現 list6 = [x for x in L if x > 20]
L1 = ['香蕉', '蘋果', '橙子'] L2 = ['可樂', '牛奶'] # 不使用列表生成式實現 list7 = [] for x in L1: for y in L2: list7.append((x, y)) # 使用列表生成式實現 list8 = [(x, y) for x in L1 for y in L2]
D = {'Tom': 15, 'Jerry': 18, 'Peter': 13} # 不使用列表生成式實現 list9 = [] for k, v in D.items(): list9.append((k, v)) # 使用列表生成式實現 list10 = [(k, v) for k, v in D.items()]
可見,使用列表生成式確實要方便、簡潔不少,使用一行代碼就搞定了。
我以爲,你們應該已經發現這裏說的列表生成式的功能與以前 這篇文章 中講到的map()和filter()高階函數的功能很像,好比下面兩個例子:
L = ['TOM', 'Peter', 10, 'Jerry'] # 用列表生成式實現 list1 = [x.lower() if isinstance(x, str) else x for x in L] # 用map()函數實現 list2 = list(map(lambda x: x.lower() if isinstance(x, str) else x, L))
L = ['TOM', 'Peter', 10, 'Jerry'] # 用列表生成式實現 list3 = [x.lower() for x in L if isinstance(x, str)] # 用map()和filter()函數實現 list4 = list(map(lambda x: x.lower(), filter(lambda x: isinstance(x, str), L)))
對於大部分需求來說,使用列表生成式和使用高階函數都能實現。可是map()和filter()等一些高階函數在Python3中的返回值類型變成了Iteraotr(迭代器)對象(在Python2中的返回值類型爲list),這對於那些元素數量很大或無限的可迭代對象來講顯然是更合適的,由於能夠避免沒必要要的內存空間浪費。關於迭代器的概念,下面會單獨進行說明。
從名字上來看,生成器應該是用來生成數據的。
按照某種算法不斷生成新的數據,直到知足某一個指定的條件結束。
構造生成器的兩種方式:
若是計算過程比較簡單,能夠直接把列表生成式改爲generator;可是,若是計算過程比較複雜,就只能經過包含yield的函數來構造generator。
說明: Python 3.3以前的版本中,不容許迭代函數法中包含return語句。
# 使用相似列表生成式的方式構造生成器 g1 = (2*n + 1 for n in range(3, 6)) # 使用包含yield的函數構造生成器 def my_range(start, end): for n in range(start, end): yield 2*n + 1 g2 = my_range(3, 6) print(type(g1)) print(type(g2))
輸出結果:
<class 'generator'> <class 'generator'>
在執行過程當中,遇到yield關鍵字就會中斷執行,下次調用則繼續從上次中斷的位置繼續執行。
要調用生成器產生新的元素,有兩種方式:
print(next(g1)) print(next(g1)) print(next(g1)) print(next(g1))
輸出結果:
7 9 11 Traceback (most recent call last): File "***/generator.py", line 26, in <module> print(next(g1)) StopIteration
print(next(g2)) print(next(g2)) print(next(g2)) print(next(g2))
輸出結果:
7 9 11 Traceback (most recent call last): File "***/generator.py", line 31, in <module> print(next(g2)) StopIteration
可見,使用next()方法遍歷生成器時,最後是以拋出一個StopIeration
異常終止。
for x in g1: print(x) for x in g2: print(x)
兩個循環的輸出結果是同樣的:
7 9 11
可見,使用循環遍歷生成器時比較簡潔,且最後不會拋出一個StopIeration
異常。所以使用循環的方式遍歷生成器的方式纔是被推薦的。
須要說明的是:若是生成器函數有返回值,要獲取該返回值的話,只能經過在一個while循環中不斷的next(),最後經過捕獲
StopIteration
異常
def my_range(start, end): for n in range(start, end): ret = yield 2*n + 1 print(ret) g3 = my_range(3, 6)
print(g3.send(None)) print(g3.send('hello01')) print(g3.send('hello02'))
輸出結果:
7 hello01 9 hello02 11
print(next(g3)) print(next(g3)) print(next(g3))
輸出結果:
7 None 9 None 11
結論:
須要注意的是:第一次調用生成器的send()方法時,參數只能爲None,不然會拋出異常。固然也能夠在調用send()方法以前先調用一次next()方法,目的是讓生成器先進入yield表達式。
既然經過列表生成式就能夠直接建立一個新的list,那麼爲何還要有生成器存在呢?
由於列表生成式是直接建立一個新的list,它會一次性地把全部數據都存放到內存中,這會存在如下幾個問題:
而生成器中的元素是按照指定的算法推算出來的,只有調用時才生成相應的數據。這樣就沒必要一次性地把全部數據都生成,從而節省了大量的內存空間,這使得其生成的元素個數幾乎是沒有限制的,而且操做的返回時間也是很是快速的(僅僅是建立一個變量而已)。
咱們能夠作個試驗:對比一下生成一個1000萬個數字的列表,分別看下用列表生成式和生成器時返回結果的時間和所佔內存空間的大小:
import time import sys time_start = time.time() g1 = [x for x in range(10000000)] time_end = time.time() print('列表生成式返回結果花費的時間: %s' % (time_end - time_start)) print('列表生成式返回結果佔用內存大小:%s' % sys.getsizeof(g1)) def my_range(start, end): for x in range(start, end): yield x time_start = time.time() g2 = my_range(0, 10000000) time_end = time.time() print('生成器返回結果花費的時間: %s' % (time_end - time_start)) print('生成器返回結果佔用內存大小:%s' % sys.getsizeof(g2))
輸出結果:
列表生成式返回結果花費的時間: 0.8215489387512207 列表生成式返回結果佔用內存大小:81528056 生成器返回結果花費的時間: 0.0 生成器返回結果佔用內存大小:88
可見,生成器返回結果的時間幾乎爲0,結果所佔內存空間的大小相對於列表生成器來講也要小的多。
咱們常常在Python的文檔中看到「Iterable」這個此,它的意思是「可迭代對象」。那麼什麼是可迭代對象呢?
可直接用於for循環的對象統稱爲可迭代對象(Iterable)。
目前咱們已經知道的可迭代(可用於for循環)的數據類型有:
可使用isinstance()來判斷一個對象是不是Iterable對象:
from collections import Iterable print(isinstance([], Iterable))
能夠被next()函數調用並不斷返回下一個值的對象稱爲迭代器:Iterator。
很明顯上面講的生成器也是迭代器。固然,咱們可使用isinstance()來驗證一下:
from collections import Iterator print(isinstance((x for x in range(5)), Iterator))
輸出結果爲:True
實際上,Python中的Iterator對象表示的是一個數據流,Iterator能夠被next()函數調用被不斷返回下一個數據,直到沒有數據能夠返回時拋出StopIteration
異常錯誤。能夠把這個數據流看作一個有序序列,但咱們沒法提早知道這個序列的長度。同時,Iterator的計算是惰性的,只有經過next()函數時纔會計算並返回下一個數據。(此段內容來自 這裏)
生成器也是這樣的,由於生成器也是迭代器。
也就是說:迭代器、生成器和可迭代對象均可以用for循環去迭代,生成器和迭代器還能夠被next()方函數調用並返回下一個值。