稍微關心編程語言的使用趨勢的人都知道,最近幾年,國內最火的兩種語言非 Python 與 Go 莫屬,因而,隔三差五就會有人問:這兩種語言誰更厲害/好找工做/高工資......程序員
對於編程語言的爭論,就是猿界的生理週期,每月都要鬧上一回。到了年底,各種榜單也是特別抓人眼球,鬧得更兇。算法
其實,它們各有對方所沒法比擬的優點以及用武之地,不少爭論都是沒有必要的。身爲一個正在努力學習 Python 的(準)中年程序員,我以爲吧,先把一門語言精進了再說。沒有差勁的語言,只有差勁的程序員,等真的把語言學好了,一定是「山重水複疑無路,柳暗花明又一村」。編程
鋪墊已了,進入今天的正題,Python 貓薦書系列之五——數組
本書適合已入門 Python、還想要進階和提升的讀者閱讀。瀏覽器
全部計算機語言說到底都是在硬件層面的數據操做,因此高性能編程的一個終極目標能夠說是「高性能硬件編程」。然而,Python 是一門高度抽象的計算機語言,它的一大優點是開發團隊的高效,不能否認地存在這樣或那樣的設計缺陷,以及因爲開發者的水平而形成的人爲的性能缺陷。緩存
本書的一大目的就是經過介紹各類模塊和原理,來促成在快速開發 Python 的同時避免不少性能侷限,既減低開發及維護成本,又收穫系統的高效。服務器
首先的一個關鍵就是性能分析,藉此能夠找到性能的瓶頸,使得性能調優作到事半功倍。微信
性能調優可以讓你的代碼可以跑得「足夠快」以及「足夠瘦」。性能分析可以讓你用最小的代價作出最實用的決定。網絡
書中介紹了幾種性能分析的工具:數據結構
(1)基本技術如 IPython 的 %timeit 魔法函數、time.time()、以及一個計時修飾器,使用這些技術來了解語句和函數的行爲。
(2)內置工具如 cProfile,瞭解代碼中哪些函數耗時最長,並用 runsnake 進行可視化。
(3)line_profiler 工具,對選定的函數進行逐行分析,其結果包含每行被調用的次數以及每行花費的時間百分比。
(4)memory_profiler 工具,以圖的形式展現RAM的使用狀況隨時間的變化,解釋爲何某個函數佔用了比預期更多的 RAM。
(5)Guppy 項目的 heapy 工具,查看 Python 堆中對象的數量以及每一個對象的大小,這對於消滅奇怪的內存泄漏特別有用。
(6)dowser 工具,經過Web瀏覽器界面審查一個持續運行的進程中的實時對象。
(7)dis 模塊,查看 CPython 的字節碼,瞭解基於棧的 Python 虛擬機如何運行。
(8)單元測試,在性能分析時要避免由優化手段帶來的破壞性後果。
做者強調了性能分析的重要性,同時也對如何確保性能分析的成功提了醒,例如,將測試代碼與主體代碼分離、避免硬件條件的干擾(如在BIOS上禁用了TurboBoost、禁用了操做系統改寫SpeedStep、只使用主電源等)、運行實驗時禁用後臺工具如備份和Dropbox、屢次實驗、重啓並重跑實驗來二次驗證結果,等等。
性能分析對於高性能編程的做用,就比如複雜度分析對於算法的做用,它自己不是高性能編程的一部分,但倒是最終有效的一種評判標準。
高性能編程最重要的事情是瞭解數據結構所能提供的性能保證。
高性能編程的很大一部分是瞭解你查詢數據的方式,並選擇一個可以迅速響應這個查詢的數據結構。
書中主要分析了 4 種數據結構:列表和元組就相似於其它編程語言的數組,主要用於存儲具備內在次序的數據;而字典和集合就相似其它編程語言的哈希表/散列集,主要用於存儲無序的數據。
本書在介紹相關內容的時候很剋制,所介紹的都是些影響「速度更快、開銷更低」的內容,例如:內置的 Tim 排序算法、列表的 resize 操做帶來的超額分配的開銷、元組的內存滯留(intern機制)帶來的資源優化、散列函數與嗅探函數的工做原理、散列碰撞帶來的麻煩與應對、Python 命名空間的管理,等等。
理解了這些內容,就能更加了解在什麼狀況下使用什麼數據結構,以及如何優化這些數據結構的性能。
另外,關於這 4 種數據結構,書中還得出了一些有趣的結論:對於一個擁有100 000 000個元素的大列表,實際分配的多是112 500 007個元素;初始化一個列表比初始化一個元組慢5.1 倍;字典或集合默認的最小長度是8(也就是說,即便你只保存3個值,Python仍然會分配 8 個元素)、對於有限大小的字典不存在一個最佳的散列函數。
矢量計算是計算機工做原理不可或缺的部分,也是在芯片層次上對程序進行加速所必須瞭解的部分。
然而,原生 Python 並不支持矢量操做,由於 Python 列表存儲的不是實際的數據,而是對實際數據的引用。在矢量和矩陣操做時,這種存儲結構會形成極大的性能降低。好比,grid[5][2]
中的兩個數字實際上是索引值,程序須要根據索引值進行兩次查找,才能得到實際的數據。
同時,由於數據被分片存儲,咱們只能分別對每一片進行傳輸,而不是一次性傳輸整個塊,所以,內存傳輸的開銷也很大。
減小瓶頸最好的方法是讓代碼知道如何分配咱們的內存以及如何使用咱們的數據進行計算。
Numpy 可以將數據連續存儲在內存中並支持數據的矢量操做,在數據處理方面,它是高性能編程的最佳解決方案之一。
Numpy 帶來性能提高的關鍵在於,它使用了高度優化且特殊構建的對象,取代了通用的列表結構來處理數組,由此減小了內存碎片;此外,自動矢量化的數學操做使得矩陣計算很是高效。
Numpy 在矢量操做上的缺陷是一次只能處理一個操做。例如,當咱們作 A * B + C 這樣的矢量操做時,先要等待 A * B 操做完成,並保存數據在一個臨時矢量中,而後再將這個新的矢量和 C 相加。
Numexpr 模塊能夠將矢量表達式編譯成很是高效的代碼,能夠將緩存失效以及臨時變量的數量最小化。另外,它還能利用多核 CPU 以及 Intel 芯片專用的指令集來將速度最大化。
書中嘗試了多種優化方法的組合,經過詳細的分析,展現了高性能編程所能帶來的性能提高效果。
書中提出一個觀點:讓你的代碼運行更快的最簡單的辦法就是讓它作更少的工做。
編譯器把代碼編譯成機器碼,是提升性能的關鍵組成部分。
不一樣的編譯器有什麼優點呢,它們對於性能提高會帶來多少好處呢?書中主要介紹了以下編譯工具:
書中分析了這幾種編譯器的工做原理、優化範圍、以及適用場景等,是不錯的入門介紹。此外,做者還提到了其它的編譯工具,如Theano、Parakeet、PyViennaCL、ViennaCL、Nuitka 與 Pyston 等,它們各有取捨,在不一樣領域提供了支撐之力。
高性能編程的一個改進方向是提升密集型任務的處理效率,而這樣的任務無非兩大類:I/O 密集型與 CPU 密集型。
I/O 密集型任務主要是磁盤讀寫與網絡通訊任務,佔用較多 I/O 時間,而對 CPU 要求較少;CPU 密集型任務偏偏相反,它們要消耗較多的 CPU 時間,進行大量的複雜的計算,例如計算圓周率與解析視頻等。
改善 I/O 密集型任務的技術是異步編程 ,它使得程序在 I/O 阻塞時,併發執行其它任務,並經過「事件循環」機制來管理各項任務的運行時機,從而提高程序的執行效率。
書中介紹了三種異步編程的庫:Gevent、Tornado 和 Asyncio,對三種模塊的區別作了較多分析。
改善 CPU 密集型任務的主要方法是利用多核 CPU 進行多進程的運算。
Multiprocessing 模塊使用基於進程和基於線程的並行處理,在隊列上共享任務,以及在進程間共享數據,是處理 CPU 密集型任務的重要技術。
書中沒有隱瞞它的侷限性:Amdahl 定律揭示的優化限度、適應於單機多核而多機則有其它選擇、全局解釋鎖 GIL 的束縛、以及進程間通訊(同步數據和檢查共享數據)的開銷。針對進程間通訊問題,書中還分析了多種解決方案,例如 Less Naïve Pool、Manager、Redis、RawValue、MMap 等。
集羣是一種多服務器運行相同任務的結構,也就是說,集羣中的各節點提供相同的服務,其優勢是系統擴展容易、具有容災恢復能力。
集羣須要克服的挑戰有:機器間信息同步的延遲、機器間配置與性能的差別、機器的損耗與維護、其它難以預料的問題。書中列舉了兩個慘痛的教訓:華爾街公司騎士資本因爲軟件升級引入的錯誤,損失4.62億美圓;Skype 公司 24 小時全球中斷的嚴重事故。
書中給咱們重點介紹了三個集羣化解決方案:Parallel Python、IPython Parallel 和 NSQ。引伸也介紹了一些廣泛使用的方案,如 Celery、Gearman、PyRes、SQS。
關於現場教訓,它們不只僅是一些事故或者故事而已,由成功的公司所總結出來的經驗更是來之不易的智慧。書中單獨用一章內容分享了六篇文章,這些文章出自幾個使用 Python 的公司/大型組織,像是Adaptive Lab、RadimRehurek、Smesh、PyPy 與 Lanyrd ,這些國外組織的一線實踐經驗,應該也能給國內的 Python 社區帶來一些啓示。
衆所周知,Python 應用前景大、簡單易學、方便開發與部署,然而與其它編程語言相比,它的性能幾乎老是落於下風。如何解決這個難題呢?本期薦書的書目就是一種迴應。
《Python高性能編程》全書從微觀到宏觀對高性能編程的方方面面作了講解,主要包含如下主題:計算機內部結構的背景知識、列表和元組、字典和集合、迭代器和生成器、矩陣和矢量計算、編譯器、併發、集羣和工做隊列等。這些內容爲編寫更快的 Python 指明瞭答案。
本篇文章主要以梳理書中的內容要點爲主,平均而兼顧地理清了全書脈絡(PS:介紹得太面面俱到了,希望不被指責爲一篇流水帳的讀書筆記纔好......)。我認爲,鑑於書中談及的這些話題,它就足以成爲咱們薦書欄目的一員了。除去某些句段的糟糕翻譯、成書時間比較早(2014年)而形成的過期外,這本書整體質量不錯,可稱爲是一份優秀的高性能編程的指引手冊。
關於薦書欄目,我最後多說幾句。本欄目原計劃兩週左右出一篇,但因爲其它系列文章花費了我很多時間,而要寫好一篇薦書/書評也特別費勁,最後生生形成了如今兩月一更的尷尬局面......這篇文章是個錯誤的示範,我不應試圖全面通讀與歸納其內容的。所以,我決定從此選一些易讀的書目,在寫做上也儘可能走短小精悍風,但願能持續地將本欄目運做下去。若你有什麼建議(如書目推薦、書評推薦、寫做建議、甚至是投稿),我隨時歡迎,先行致謝啦。
往期薦書回顧: 第一期:《編寫高質量代碼改善 Python 程序的 91 個建議》 第二期:《Python最佳實踐指南》 第三期:《黑客與畫家》 第四期:《Python源碼剖析》
-----------------
本文原創並首發於微信公衆號【Python貓】,後臺回覆「愛學習」,免費得到20+本精選電子書。