對於數據科學家來講,R語言無疑是他們的選擇,可是Python正在搶奪R語言的地盤。python
關於這個改變有不少的緣由,或許最大的緣由是相對於R語言的難以掌握的複雜編程環境來講,Python更加通用,並且更加簡單。編程
在一個愈來愈依賴數據世界,「簡單」確定會取得勝利。segmentfault
人們煞費苦心地學習R語言一部分緣由是它並非一門編程語言。正如專家John Cook指出,R語言實際是一種數據統計的交互環境,並不真的是一門編程語言。他建議,與其把R語言當作一種編程語言倒不如認爲它有編程語言的特性。數組
並且,R語言看起來一點都不像傳統的編程語言,這對於將要成爲R語言開發者來講,很難掌握。編程語言
可是R語言對於像這些數據統計的工具,好比SAS,SPSS,如Bob Muenchen指出R語言對於分析師來講能夠說是減小了複雜度,由於它合併了宏(Marcro)和矩陣語言,而在其餘語言中,好比SPSS,就須要你本身去掌握。可是若是期待R語言能夠像Stata同樣,他們會失望的。工具
綜上,R語言。。。是不同的,讓事情變難了。。。學習
然而Python是很是容易學習的。就拿一件事情來講吧,大多開發者都熟悉Python,並且能夠在多種程序中使用它。不像R語言,只能用戶數據分析領域,一個開發者能夠在首次用腳本編寫她的網站或者別的程序的時候就體驗Python語言。大數據
當企業苦苦地讓數據工做的時候,他們還煞費苦心的尋找合格的數據科學家。然而,每每這樣的數據科學家已經爲他們工做了,並且應該熟悉Python。由於根據用戶的數據提供正確的分析是如此的重要,因此在複雜的用戶數據下,企業本身培養的大數據技術人才比須要本身培訓新應聘的數據科學家高效得多。就像 Gartnet 的Svetlana Sicular所說的網站
先不說使用現成的Python人才庫,使用Python最大的受益是增長使用同一種編程語言在不一樣程序中的效率。德克薩斯大學奧斯汀分校研究員 Tai Yarkoni 解釋:spa
已經代表使用同一種語言進行開發和分析會受益不淺。就這麼一點來講吧,當你能夠只用一種語言來作全部的事情,你沒有必要折磨本身說,Ruby使用block代替縮進,或者你須要在Python中調用數組的
len
方法而不是array.length
來獲取數組的長度。
並且,你永遠不用擔憂項目中不一樣語言之間的接口問題。沒有比在Python中處理相同的文字數據煩人了,最後把它們變成你想要的格式,而後才知道你不得不把它們以另外一種格式寫入磁盤,以致於你能夠把它們轉交給R語言或者Matlab來進行別的分析。個別的,這不是大問題。在Python中把它們以CSV格式或者JSON格式文件輸出,在R中讀取,進行加和。若是隻用一種語言,全部這些都再也不會有。
這並無誇張的部分。當咱們讚美合適的技術很好地解決了咱們的問題的時候,技術就會勝出,這是通用的道理。就像 Optimization and Analytics 的 AppNexus 的董事David Himrod說的,「在AppNexus面臨的最大的挑戰是如何在統一技術領域聘到多樣的員工。Python爲員工提供了不一樣的背景,特別是工程師,數學家,分析師---一種常見的,簡單易懂的語言能夠被公司用來定義新的功能原型。」
Python在數據分析方面仍然欠缺一些R語言的豐富性,可是兩者的間距正在快速縮小.
要記住:Python成功的關鍵不是它處理神祕方法的能力上比R語言或者別的與前強,而是它容易學習和通用性。數據科學已經脫離初級極客的境界了,在上個月O'Reilly Strata大會上已經很是明顯了。哲學博士們曾常常常出沒的大會,如今普通的經濟分析師和一些受企業派遣去分析大數據的人,已經成爲這次大會的主要參加者。
此次新的大會更傾向於使用Python而不是R語言。Python相對來講簡單易用,並且它們已經在別的項目中使用了它。在別的方面,人們更加傾向於已經精通的或者簡單易學的工具而不是強大而複雜的工具,若是可能的話,應該避免使用這樣強大而複雜的工具。
Source:http://readwrite.com/2013/11/25/python-displacing-r-as-the-programming-language-for-data-science