四大機器學習編程語言對比:R、Python、MATLAB、Octave

 

本文做者是一位機器學習工程師,他比較了四種機器學習編程語言(工具):R、Python、MATLAB 和 OCTAVE。做者列出了這些語言(工具)的優缺點,但願對想開始學習它們的人有用。python

 

圖源:Pixabay.comgit

 

GitHub 地址:https://github.com/mjbahmani/10-steps-to-become-a-data-scientistgithub

 

 R 語言算法

 

R 是一種用於統計計算和圖的語言及環境。它是一個 GNU 項目,與貝爾實驗室的 John Chambers 及其同事開發的 S 語言及環境相似。R 能夠視爲 S 的一種不一樣實現。兩者存在一些重要差別,但使用 S 寫的不少代碼在 R 下運行時無需修改。編程

 

優勢:多線程

 

  • 端到端開發到執行(一些 brokers package 容許執行,IB)app

  • 開發速度快(比 Python 的代碼少 60%)機器學習

  • 開源包多編程語言

  • 成熟的量化交易包(quantstrat、quantmod、performanceanalyitics、xts)函數

  • 社區最大

  • 使用 rcpp 能夠整合 R 和 C++/C 

 

缺點:

 

  • 比 Python 慢,尤爲是在迭代循環和非向量化函數中

  • 比 Matlab 繪圖差,難以實現交互式圖表

  • 建立獨立應用程序的能力有限

 

 Python

 

Python 是一種用於通用編程的解釋型高級編程語言,由 Guido van Rossum 建立並於 1991 年首次發佈。Python 的設計強調代碼可讀性,使用了大量空格。它的結構使其在大規模和小規模編程中都能清晰明瞭。

 

優勢:

 

  • 端到端開發到執行(一些 brokers package 容許執行,IB)

  • 開源包(Pandas、Numpy、scipy)

  • 交易包(zipline、pybacktest、pyalgotrade)

  • 最適合通常編程和應用程序開發

  • 可鏈接 R、C++ 和其餘語言的「膠水」語言

  • 整體速度最快,尤爲是在迭代循環中

 

缺點:

 

  • 有一些不成熟的包,尤爲是交易包

  • 有些包與其餘包不兼容或包含重疊

  • 在金融領域的社區比 R 小

  • 與 R 或 Matlab 相比,相同操做須要更多代碼

  • 追蹤靜默錯誤(silent error)可能須要很長時間(即便使用可視化調試器/IDE)

 

 MATLAB

 

MATLAB(matrix laboratory)是一種多範型數值計算環境。做爲 MathWorks 開發的一種專用編程語言,MATLAB 容許矩陣運算、函數和數據繪圖、算法實現、用戶界面建立,以及與用其餘語言(包括 C、C++、C#、Java、Fortran、Python)寫成的程序進行交互。

 

儘管 MATLAB 的設計初衷是數值計算,但其中的可選工具箱使用 MuPAD symbolic engine,具有符號計算能力。額外的包 Simulink 添加了圖多領域模擬和針對動態和嵌入系統的基於模型的設計。

 

優勢:

 

  • 最快的數學和計算平臺,尤爲是向量化運算/線性矩陣代數。

  • 適合全部數學和交易領域的商業級軟件。

  • 腳本簡短,但高度集成了全部包。

  • 擁有圖和交互式圖表的最佳可視化

  • 具有良好測試和支持。

  • 易於管理多線程支持和垃圾收集

  • 最好的調試器

 

缺點:

 

  • 沒法執行,必須轉換成另外一種語言。

  • 昂貴:每一個 license 大約 1000 美圓,每添加一個包須要額外支付 50+ 美圓。

  • 沒法與其餘語言很好地集成。

  • 很難檢測出交易系統中的誤差(它是爲數學和工程模擬而構建的),所以可能須要普遍的測試。

  • 糟糕的迭代循環性能。

  • 沒法開發單獨的應用。

 

 Octave

 

Octave 能夠看做是商業語言 MATLAB 的 GNU 版本,它是一種腳本矩陣語言(scripting matrix language),其語法有大約 95% 可與 MATLAB 兼容。Octave 由工程師設計,所以預裝了工程師經常使用的程序,其中不少時間序列分析程序、統計程序、文件命令和繪圖命令與 MATLAB 語言相同。

 

優勢:

 

  • 首先,目前沒有可用的魯棒性 Octave 編譯器,且沒有必要有,由於該軟件能夠免費安裝。

  • Octave 和 Matlab 的語言元素相同,除了一些個例,如嵌套函數。Octave 仍然處於積極開發的狀態,每個偏離 Matlab 語法之處都被視爲 bug 或者至少是待解決問題。

  • Octave 有不少可用工具箱,只要程序不要求圖輸出,那麼在不進行大量更改的前提下,使用 Octave 運行和使用 Matlab 運行差很少。

  • 圖方面的能力是 Matlab 的優點。Matlab 最新版本包括 GUI 設計器,包含大量很棒的可視化特徵。

  • Octave 使用 GNU Plot 或 JHandles 做爲圖程序包,JHandles 與 Matlab 中的圖程序包更接近一些。可是,Octave 不具有相似 GUI 設計器的組件,其可視化機制很受限且不與 Matlab 兼容。

  • 集成開發環境也是相似的狀況:Octave 有一個 QTOctave 項目,但仍處於早期階段。

  • Octave 社區的合做極可能幫助該軟件很快提供更好、更兼容的圖以及 GUI 能力。

 

缺點:

 

  • 它只是 MATLAB 的免費開源版本,沒法帶給用戶新的東西。

 

 

 

下表列舉了數據科學家和機器學習工程師的經常使用工具,讀者能夠查看這些工具的流行度。

 

 

原文連接:https://towardsdatascience.com/r-vs-python-vs-matlab-vs-octave-c28cd059aa69

相關文章
相關標籤/搜索