本文轉載自公衆號「讀芯術」(ID:AI_Discovery)。python
當咱們說起Python時,經常指的是CPython,即C語言實現的Python,這就是PyPy發揮做用的地方啦。實話講,Python很慢,而用Python(!)編寫的Python在運行時,執行速度比CPython快4.4倍。這是如何實現的呢?git
正如Python之父吉多·範羅蘇姆(Guido van Rossum)所說:「若是想讓代碼運行得更快,應該使用PyPy。」程序員
第一批使用PyPy的程序員競爭力很強。有時候,就算花了不少時間用Python編寫解決方案,最後也會失敗,可是在PyPy中運行一樣的代碼就會成功。這是爲何?github
不一樣的方法算法
Python是一種解釋性語言,CPython逐行讀取並執行源代碼。解釋性語言(包括JavaScript)有不少優勢:編程
易於編寫c#
元編程能力強大後端
編譯不會失敗數據結構
固然,它也有一些缺點:多線程
在解析源代碼時,性能消耗巨大
編譯不會失敗
能夠看到,其優缺點都包括了「編譯不會失敗」。這有時候基於不一樣的行爲(好比原型設計或生產),但我仍然傾向於將其視爲一個缺點。而PyPy稍有不一樣,它不是一個純粹的解釋器,而是實現了跟蹤即時(JIT)編譯。
即時編譯
即時編譯介於解釋和傳統提早編譯之間。即時編譯器並不執行源代碼自己,而是生成一組可當即執行的低層指令(一般是彙編)。
這個插圖能夠幫助咱們理解其中的區別。在編譯語言(C、C++、Rust)中,編譯階段嚴格按照開發環境劃分。它生成一個可運行的二進制文件,而後將其發送到生產環境中。
在解釋性語言中,狀況正好相反:源代碼(在*化以後,hello JS)被所有推到生產環境中,由解釋器執行。即時編譯語言也運送源代碼(或字節碼,如Java或C#),但它是做爲一種常規編譯語言編譯和運行,而不是逐行解釋。
並非說一種方法比另外一種好,每一個用例都將根據其獨特的需求指定正確的選擇。可是,若是性能很是關鍵,使用Python解釋器感受很舒服,那麼你能夠選擇PyPy。
跟蹤即時編譯
與編譯或解釋同樣,實現即時編譯也有不一樣的方法。傳統的方法是方法/函數做用域。當代碼調用一個函數時,即時編譯器將得到它的源代碼,進行編譯並提供可執行的二進制文件。而PyPy採用的方法稍微不一樣,這是由Python的特性和用例決定的。
PyPy的編譯器不是按方法調用,而是計算循環。因爲Python在數據科學、機器學習、高級算法以及數據結構中使用普遍,這是最有意義的。簡而言之,PyPy是Python之上的一個優化層。
PyPy並不像所理解的那樣嚴格處理循環。除了常規的for和while結構外,若是PyPy檢測到編譯工做有價值,它會優化任意代碼塊。
缺點
圖源:unsplash
固然,PyPy也有缺點。即便它能大大提升性能,你也須要知道如下幾點:
不支持全部的Python。它支持大部分代碼,可是若是處理底層的CPython實現細節或者有Cython綁定,它就不起做用了。
回溯將來。PyPy當前版本是3.4,而Python目前穩定在3.8,可是回溯法是Python開發者擅長的技術。
優化是好事,但不是編寫糟糕代碼的藉口。若是代碼沒法被人讀懂, PyPy又怎能理解呢?
全局解釋器鎖還在。若是執行繁重的多線程操做,請選擇其餘實現方法。
與任何工具同樣,在採用以前,咱們應該考慮全部的細節。不過,下次登陸到Codeforces接受挑戰時,不妨試用一下PyPy。有可能O(n^3)錯誤代碼會經過,而在純Python中,只有O(n log n)會經過。
源代碼
雖然本文沒有涉及CPython和PyPy的源代碼,可是這些文件在CPython (C代碼)和PyPy (Python代碼)中實現了階乘函數。
CPython:https://github.com/python/cpython/blob/master/Modules/mathmodule.c
PyPy:https://github.com/mozillazg/pypy/blob/50d6bf76ef1f93c234ab42d4dd4a3b974f9665d6/pypy/module/math/app_math.py
其餘實現
除了CPython和PyPy,還有其餘值得注意的Python實現:
StacklessPython。它和Python相同,但沒有全局解釋器鎖,《星戰前夜》遊戲後端用的就是它。
IronPython是一種在 NET上實現的 Python 語言,它爲Python和c#代碼提供了很是簡單的交互操做。
JPython同理,可是有Java。
去試試使用PyPy來體驗代碼加速度吧!
【責任編輯:趙寧寧 TEL:(010)68476606】