例子以下:html
oldlist = [[1, 2, 3], [4, 5]] # 想獲得結果: newlist = [1, 2, 3, 4, 5]
原始數據是一個二維列表,目的是獲取該列表中全部元素的具體值。從抽象一點的角度來理解,也可看做是列表解壓或者列表降維。python
這個問題並不難,可是,怎麼寫才比較優雅呢?設計模式
# 方法一,粗暴拼接法: newlist = oldlist[0] + oldlist[1]
這種方法簡單粗暴,須要拼接什麼內容,就取出來直接拼接。然而,若是原列表有不少子列表,則這個方法就會變得繁瑣了。markdown
咱們把原問題升級一下:一個二維列表包含 n 個一維列表元素,如何優雅地把這些子列表拼成一個新的一維列表?ide
方法一的作法須要寫 n 個對象,以及 n - 1 次拼接操做。固然不可行。下面看看方法二:函數
# 方法二,列表推導式: newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]
這個表達式中出現了兩個 for 語句,在第一個 for 語句中,咱們先取出原列表的長度,而後構造 range 對象,此時 j 的取值範圍是 [0, n-1] 的閉區間。post
在第二個 for 語句中,oldlist[j] 指的正是原列表的第 j 個子列表,for i in oldlist[j]
則會遍歷取出 j 子列表的元素,因爲 j 取值的區間正對應於原列表的所有索引值,因此,最終達到解題目的。學習
這種方法足夠優雅了,並且理解也並不難。設計
然而,咱們是否就能知足於此了呢?有沒有其它奇技淫巧,哦不,是其它高級方法呢?F 同窗貢獻了一個思路:code
# 方法三,巧用sum: newlist = sum(oldlist,[])
說實話,這個方法令我大感意外!sum() 函數不是用於求和的麼?怎麼居然有此用法?
這個寫法利用了什麼原理呢?因爲我開始時不知道 sum() 函數能夠接收兩個參數,不清楚它們是怎麼用於計算的,因此一度很困惑。可是,當我知道 sum() 的完整用法時,我恍然大悟。
接下來也不賣關子了,直接揭曉吧。
語法: sum(iterable[, start])
,sum() 函數的第一個參數是可迭代對象,如列表、元組或集合等,第二個參數是起始值,默認爲 0 。其用途是以 start 值爲基礎,再與可迭代對象的全部元素相「加」。
在上例中,執行效果是 oldlist 中的子列表逐一與第二個參數相加,而列表的加法至關於 extend 操做,因此最終結果是由 [] 擴充成的列表。
這裏有兩個關鍵點:sum() 函數容許帶兩個參數,且第二個參數纔是起點。 可能 sum() 函數用於數值求和比較多,然而用於做列表的求和,就有奇效。它比列表推導式更加優雅簡潔!
至此,前面的升級版問題就獲得了很好的回答。簡單回顧一下,s 同窗最初的問題能夠用三種方法實現,第一種方法中規中矩,第二種方法正道進階,而第三種方法旁門左道(沒有貶義,只是說它出人意料,卻效果奇佳)。
這道並不算難的問題,在衆人的討論與分享後,竟還引出了頗有價值的學習內容。前不久,一樣是羣內的一個問題,也產生了一樣的學習效果,詳見《Python進階:如何將字符串常量轉爲變量?》。
我從中獲得了一個啓示:應該多角度地思考問題,設法尋求更優解,同時,基礎知識應掌握牢固,並靈活貫通起來。
學無止境,這裏我還想再開拓一下思路,看看能發現些什麼。
一、若是原列表的元素除了列表,還有其它類型的元素,怎麼把同類的元素歸併在一塊兒呢?
二、若是是一個三維或更高維的列表,怎麼更好地把它們壓縮成一維列表呢?
三、sum() 函數還有什麼知識要點呢?
前兩個問題增長了複雜度,解決起來彷佛沒有「靈丹妙藥」了,只能用笨方法分別拆解,逐一解壓。
第三個思考題是關於 sum() 函數自己的用法,咱們看看官方文檔是怎麼說的:
The iterable’s items are normally numbers, and the start value is not allowed to be a string.
For some use cases, there are good alternatives to
sum()
. The preferred, fast way to concatenate a sequence of strings is by calling''.join(sequence)
. To add floating point values with extended precision, seemath.fsum()
. To concatenate a series of iterables, consider usingitertools.chain()
.
sum() 的第二個參數不容許是字符串。若是用了,會報錯:
TypeError: sum() can't sum strings [use ''.join(seq) instead]
爲何不建議使用 sum() 來拼接字符串呢?哈哈,文檔中建議使用 join() 方法,由於它更快。爲了避免給咱們使用慢的方法,它竟特別限定不容許 sum() 的第二個參數是字符串。
文檔還建議,在某些使用場景時,不要用 sum() ,例如當以擴展精度對浮點數求和時,推薦使用 math.fsum()
;當要拼接一系列的可迭代對象時,應考慮使用 itertools.chain()
。
浮點數的計算是個難題,我曾轉載過一篇《如何在 Python 裏面精確四捨五入?》,對此有精彩分析。而itertools.chain()
能夠將不一樣類型的可迭代對象串聯成一個更大的迭代器,這在舊文《Python進階:設計模式之迭代器模式》中也有論及。
不經意間,sum() 函數的注意事項,竟把 Python 其它的進階內容都聯繫起來了。小小的函數,竟成爲學習之路上的一個樞紐。