做者 | 宋天龍
來源 | AI科技大本營
導語:一切都始於1989年的那個聖誕節,Python的誕生並不算恰逢其時,它崛起充滿了機遇巧合,也有其必然性。三十年間,Python技術不斷更迭,生態逐漸完善,加上互聯網、大數據、以及人工智能這一波波浪潮的推波助瀾,Python漸漸從小衆最終站上了如今的高度。html
從歷史發展的角度出發,咱們才能看清Python崛起的偶然性和必然性。本文將結合技術和產業的發展,全面透析Python的演進之路,幫助讀者理解是什麼造就了現在的Python。程序員
Guido van Rossum(下面簡稱Guido)是Python語言之父,他於1982年從阿姆斯特丹大學得到了數學和計算機碩士雙學位,期間他接觸了不少的語言,包括Pascal,C,Fortran等。正則表達式
在那個計算機資源貧乏的年代,像計算機同樣思考並編程是每一個程序員必須面對的事情,這讓他很是苦惱;同時他又很是欣賞shell,shell簡單易編程的特性讓程序員更加專一於設計和邏輯自己,但shell本質上是一個功能的調用,它沒有本身的數據類型,更沒法全面調用計算機功能,所以shell也不算是一門「語言」。shell
所以,他但願找到一種語言既能夠像使用shell同樣簡單,又能夠和C語言的功能相媲美。不過這種語言在那個年代並不存在。數據庫
1989年的聖誕節,Guido開始編寫Python語言的編譯器。Python這個名字來源於他喜歡的電視劇Monty Python’s Flying Circus,而不是表面意義上的「蟒蛇」。他但願這個新的語言,能符合他的理想:介於C和shell之間,功能全面、易學、易用又可拓展。編程
1991年,第一個Python編譯器誕生,這標誌着Python的第一個版本正式誕生。它基於C語言,並具有了基礎的類、函數、異常處理等功能特性,同時具有可擴展性。Python語法不少來自C,但又受到ABC語言的強烈影響。例如來源於ABC語言強制縮進的規定自己可讓Python容易讀,但若是縮進出錯卻會影響編譯和執行。Python自己不以性能爲重,但當確實須要考慮性能時,Python程序員卻能夠深刻底層來編寫C程序,並編譯爲.so文件引入到Python中使用。後端
Python語言的魅力在於讓程序員能夠花更多的時間用於思考程序的邏輯,而不是具體的實現細節,這一特性也獲得Guido同事的歡迎。他們在反饋使用意見的同時也參與到Python的改進中來,所以最初Guido和一些同事構成了Python的核心團隊,固然,核心決策者仍是Guido本人。隨後,Python的使用拓展到研究所以外,並吸引了愈來愈多的程序員。數組
可是,最初Python的使用很是小衆,由於在那個計算機資源很是有限的年代,你們都傾向於最大化榨取計算機資源並提高運算效率,而Python顯然不是爲此而生。網絡
最初發布時,Python在設計層面存在一些缺陷,例如以知足跨語言、跨平臺進行文本轉換、處理的要求的Unicode字符編碼標準在1994年才正式公佈,因此一直以來Python 2及以前的版本對Unicode的支持並不徹底。相信你們在使用Python 2版本處理中文時都遇到過各類問題。數據結構
2000年發佈的Python 2.0標誌着Python的框架基本肯定。重要框架方向包括:
1965年,戈登·摩爾提出了著名的摩爾定律,其內容爲:當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增長一倍,性能也將提高一倍。在隨後超過半個世紀的時間裏,我的計算機的發展突飛猛進,已經由資源不足向資源過剩轉變。這客觀上爲Python的應用提供了基礎條件——只有在資源過剩的條件下,程序員纔不會過分關注榨取性能。
隨着Python自身功能的完善以及生態系統的擴展,Python在Web開發、網絡爬蟲、數據分析與數據挖掘、人工智能等應用方面逐漸嶄露頭角。
2004年,目前最流行的WEB框架Django誕生。2010年,另外一個流行的輕量級WEB框架Flask誕生。Django是一個WEB解決方案「全家桶」,其功能大而全,包含了幾乎全部WEB開發相關的組件和功能,它能夠大大節省開發者在基礎組件、選型、適配等方面的時間和精力;而Flask只包含基本的配置,默認依賴於兩個外部庫也能夠自由替換,給開發者提供最大的自主空間。這兩類徹底相反方向上的WEB開發模式,幾乎能夠爲全部開發者提供了很好的選型參照物:不管開發者想要一站式仍是最大化自主解決方案,Python都能知足。
此後,以豆瓣、春雨醫生、知乎、Dropbox、YouTube、CIA(美國中情局)等爲表明的企業和機構都基於Python作網站開發,預示着Python應用到WEB開發領域逐漸成爲一種新興趨勢。
Python自帶的標準庫中,urllib、urllib二、requests庫對於簡單網頁的抓取實現很是簡單,即便在面對海量數據抓取需求時,第三方庫Scrapy也能應對自如;再配合正則表達式庫re、網頁代碼解析BeautifulSoup、html和xml解析庫lxml、多線程庫threading等特性,使得Python在應用到網絡爬蟲任務上時,只須要不多的開發量便能迅速完成任務。基於Python簡單易學的特性,幾乎人人都能開發網絡爬蟲。
Python是跨語言和平臺的,幾乎全部Linux系統和MAC系統都自帶Python庫,Windows系統也能夠自定義安裝。Python默認的os、sys等庫可實現與操做系統的交互和執行功能,更重要的是Python還能直接執行系統終端命令。所以,使用Python編寫的系統運維和管理腳本在可讀性、性能、代碼重用度、擴展性幾方面都優於普通的shell腳本,在自動化運維方面應用普遍。
2008年發佈的Numpy、scipy和2009年發佈的pandas是數據分析與科學計算的三劍客。
NumPy(Numeric Python的簡稱)是Python科學計算的基礎工具包,也是Python作數據計算的關鍵庫之一,同時又是不少第三方庫的依賴庫。
Scipy(Scientific Computing Tools for Python的簡稱)是一組專門解決科學和工程計算不一樣場景的主題工具包,它提供的主要功能側重於數學、函數等,例如積分和微分方程求解。Pandas(Python Data Analysis Library的簡稱)是一個用於Python數據分析的庫,它的主要做用是進行數據分析和預處理。
Pandas提供用於進行結構化數據分析的二維表格型數據結構DataFrame,相似於R中的數據框,能提供相似於數據庫中的切片、切塊、聚合、選擇子集等精細化操做,爲數據分析提供便捷。另外,Pandas還提供了時間序列的功能,用於金融行業的數據分析。
除此以外,不少大型公司也都在使用Python完成不一樣類型的其餘工做,其中不乏世界知名公司,如國外的Google、Facebook、NASA 、雅虎、YouTube等,國內的網易、騰訊、搜狐、金山等。例如谷歌在Google Groups、Gmail、Google Maps等項目中將Python用做網絡應用的後端;在Google Cloud Platform中的Google Cloud Storage本地部署環境中,gsutil也在Python 2基礎上開發和應用。
2008年12月,Python 3發佈。Python 3相對於Python 2的早期版本(主要是Python2.6以前)是一個較大的升級,它在設計的時候沒有考慮向下兼容,因此不少早期版本的Python程序沒法在Python 3上運行。爲了照顧早期的版本,推出過渡版本2.6——基本使用了Python 2.x的語法和庫,同時考慮了向Python 3.0的遷移,容許使用部分Python 3.0的語法與函數。同時,Python還提供了Python 2到Python 3的Python文件轉換功能,以幫助開發者升級。
2010年7月發佈了Python 2.x系列的最後一個版本,主版本號爲2.7。大量Python 3的特性被反向遷移到了Python 2.7,2.7版本比2.6版本進步很是多,同時擁有大量Python 3中的特性和庫,而且照顧了原有的Python開發人羣。Python2.7也是當前絕大多數Linux操做系統最新版本的默認Python版本。
從2008年開始,Python 2與Python 3是並存發展的。但在2018年3月,Guido在郵件列表上宣佈Python 2.7將於2020年1月1日終止支持,這意味着以後Python 2將再也不被統一維護,與之對應的是主流第三方庫也不會再提供針對Python 2版本的開發支持。Python 2的時代即將過去。
這一時期,Python繼續以其獨特魅力吸引更多的開發者加入,但真正讓Python大放異彩的倒是AI(人工智能)的爆發。
AI並非一個新生事物,而是從20世紀50年代就開始出現,隨後通過了大概20年的黃金時期,又分別在20世紀70年代和90年代兩次進入寒冬期。從2006年開始,神經網絡、深度學習的出現,讓AI進入爆發期。
在AI領域,Python擁有不少相關庫和框架。其中最著名的是:
在互聯網領域,Facebook和Google都是全球IT企業的標杆,具有行業領導力和風向指示意義。他們基於Python開發的AI庫(PyTorch和TensorFlow)已經成爲目前最流行的AI庫,並且「到底選擇PyTorch仍是Tensorflow」仍然是一個具備爭議性的話題。
在AI時代,主要應用場景包括:
在不一樣的領域,Python都能扮演很是重要的角色,所以,在國外的各大榜單中,Python都已經成爲最受歡迎的語言(或至少是之一)。不僅在商業領域流行,國內不少地區和教育機構正將Python歸入教材之中。好比Python進入山東小學六年級的教材,浙江信息技術教材將放棄VB,改用Python 語言,Python列入全國計算機二級等級考試大綱等。
在Python發展過程當中,Guido一直是核心人物,甚至被稱爲「終身仁慈獨裁者」,但在2018年經歷了退出管理層風波以後,他又在2019年以五大指導委員之一的身份重回決策層。這爲Python迎來了新的治理方案:指導委員會模式。這種模式意味着Python的將來將從Guido一人決定變爲5人決定,雖然比不少開源語言仍然有民主化空間(例如PHP的改進由社區投票決定),但也算是一種從專制到民主的進步。
有關Python的每一個提高計劃,都是在PEP(Python Enhancement Proposal)列表中——每一個版本新特性和變化都經過PEP提案通過社區決策層討論、投票決議,最終纔有咱們看到的功能。
目前,Python的最新穩定的主版本是3.7,Python 3.8也已經有了預覽版,大概在2023年左右Python 4便會問世。在以後的時間裏,Python會如何發展?咱們能夠從Python軟件基金會的董事會成員、CPython的核心開發人員Nick Coghlan的信息中略知一二:
首先,Python的PEP流程和制度沒有任何變化,經過增長新模塊和功能來加強的基礎能力。隨着Python 2在2020年再也不維護,社區在Python 3的資源和投入會相應增長。
其次,不一樣解釋器的實現和功能擴展還將繼續加強,方向包括PyPy關於JIT編譯器生成和軟件事務內存的嘗試,以及科學和數據分析社區,對面向數組編程的探索等。
再次,嵌入式應用的加強,核心是與其餘虛擬機運行時(如JVM和CLR)的集成和改進,尤爲是在教育領域取得的進展,可能會讓Python做爲更受歡迎的嵌入式腳本語言,在更大的應用程序中運行。
最後,對於爲了兼容和維持Python 2的部分功能而存在於Python 3中的原有代碼,在後續版本中應該會逐步優化甚至去掉。而對於其餘更改,則會根據狀況棄用、提出警告、逐步替代以及保留。