本文彙編了一些機器學習領域的框架、庫以及軟件(按編程語言排序)。javascript
C++
計算機視覺
- CCV —基於C語言/提供緩存/核心的機器視覺庫,新穎的機器視覺庫
- OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,並支持Windows, Linux, Android and Mac OS操做系統。
通用機器學習
Closure
通用機器學習
Go
天然語言處理
通用機器學習
數據分析/數據可視化
Java
天然語言處理
通用機器學習
數據分析/數據可視化
Javascript
天然語言處理
數據分析/數據可視化
通用機器學習
Julia
通用機器學習
天然語言處理
數據分析/數據可視化
雜項/演示文稿
Lua
通用機器學習
- Torch7
- cephes —Cephes數學函數庫,包裝成Torch可用形式。提供幷包裝了超過180個特殊的數學函數,由Stephen L. Moshier開發,是SciPy的核心,應用於不少場合。
- graph —供Torch使用的圖形包。
- randomkit—從Numpy提取的隨機數生成包,包裝成Torch可用形式。
- signal —Torch-7可用的信號處理工具包,可進行FFT, DCT, Hilbert, cepstrums, stft等變換。
- nn —Torch可用的神經網絡包。
- nngraph —爲nn庫提供圖形計算能力。
- nnx—一個不穩定實驗性的包,擴展Torch內置的nn庫。
- optim—Torch可用的優化算法庫,包括 SGD, Adagrad, 共軛梯度算法, LBFGS, RProp等算法。
- unsup—Torch下的非監督學習包。提供的模塊與nn(LinearPsd, ConvPsd, AutoEncoder, …)及獨立算法 (k-means, PCA)等兼容。
- manifold—操做流形的包。
- svm—Torch的支持向量機庫。
- lbfgs—將liblbfgs包裝爲FFI接口。
- vowpalwabbit —老版的vowpalwabbit對torch的接口。
- OpenGM—OpenGM是C++編寫的圖形建模及推斷庫,該binding能夠用Lua以簡單的方式描述圖形,而後用OpenGM優化。
- sphagetti —MichaelMathieu爲torch7編寫的稀疏線性模塊。
- LuaSHKit —將局部敏感哈希庫SHKit包裝成lua可用形式。
- kernel smoothing —KNN、核權平均以及局部線性迴歸平滑器
- cutorch—torch的CUDA後端實現
- cunn —torch的CUDA神經網絡實現。
- imgraph—torch的圖像/圖形庫,提供從圖像建立圖形、分割、創建樹、又轉化回圖像的例程
- videograph—torch的視頻/圖形庫,提供從視頻建立圖形、分割、創建樹、又轉化回視頻的例程
- saliency —積分圖像的代碼和工具,用來從快速積分直方圖中尋找興趣點。
- stitch —使用hugin拼合圖像並將其生成視頻序列。
- sfm—運動場景束調整/結構包
- fex —torch的特徵提取包,提供SIFT和dSIFT模塊。
- OverFeat—當前最高水準的通用密度特徵提取器。
- Numeric Lua
- Lunatic Python
- SciLua
- Lua – Numerical Algorithms
- Lunum
演示及腳本
Matlab
計算機視覺
天然語言處理
通用機器學習
數據分析/數據可視化
.NET
計算機視覺
- OpenCVDotNet —包裝器,使.NET程序能使用OpenCV代碼
- Emgu CV—跨平臺的包裝器,能在Windows, Linus, Mac OS X, iOS, 和Android上編譯。
天然語言處理
通用機器學習
- Accord.MachineLearning —支持向量機、決策樹、樸素貝葉斯模型、K-means、高斯混合模型和機器學習應用的通用算法,例如:隨機抽樣一致性算法、交叉驗證、網格搜索。這個包是Accord.NET框架的一部分。
- Vulpes—F#語言實現的Deep belief和深度學習包,它在Alea.cuBase下利用CUDA GPU來執行。
- Encog —先進的神經網絡和機器學習框架,包括用來建立多種網絡的類,也支持神經網絡須要的數據規則化及處理的類。它的訓練採用多線程彈性傳播。它也能使用GPU加快處理時間。提供了圖形化界面來幫助建模和訓練神經網絡。
- Neural Network Designer —這是一個數據庫管理系統和神經網絡設計器。設計器用WPF開發,也是一個UI,你能夠設計你的神經網絡、查詢網絡、建立並配置聊天機器人,它能問問題,並從你的反饋中學習。這些機器人甚至能夠從網絡蒐集信息用來輸出,或是用來學習。
數據分析/數據可視化
- numl —numl這個機器學習庫,目標就是簡化預測和聚類的標準建模技術。
- Math.NET Numerics—Math.NET項目的數值計算基礎,着眼提供科學、工程以及平常數值計算的方法和算法。支持 Windows, Linux 和 Mac上的 .Net 4.0, .Net 3.5 和 Mono ,Silverlight 5, WindowsPhone/SL 8, WindowsPhone 8.1 以及裝有 PCL Portable Profiles 47 及 344的Windows 8, 裝有 Xamarin的Android/iOS 。
- Sho —Sho是數據分析和科學計算的交互式環境,可讓你將腳本(IronPython語言)和編譯的代碼(.NET)無縫鏈接,以快速靈活的創建原型。這個環境包括強大高效的庫,如線性代數、數據可視化,可供任何.NET語言使用,還爲快速開發提供了功能豐富的交互式shell。
Python
計算機視覺
- SimpleCV—開源的計算機視覺框架,能夠訪問如OpenCV等高性能計算機視覺庫。使用Python編寫,能夠在Mac、Windows以及Ubuntu上運行。
天然語言處理
- NLTK —一個領先的平臺,用來編寫處理人類語言數據的Python程序
- Pattern—Python可用的web挖掘模塊,包括天然語言處理、機器學習等工具。
- TextBlob—爲普通天然語言處理任務提供一致的API,以NLTK和Pattern爲基礎,並和二者都能很好兼容。
- jieba—中文斷詞工具。
- SnowNLP —中文文本處理庫。
- loso—另外一箇中文斷詞庫。
- genius —基於條件隨機域的中文斷詞庫。
- nut —天然語言理解工具包。
通用機器學習
數據分析/數據可視化
雜項腳本/iPython筆記/代碼庫
Kaggle競賽源代碼
Ruby
天然語言處理
通用機器學習
數據分析/數據可視化
Misc
雜項
R
通用機器學習
數據分析/數據可視化
Scala
天然語言處理
數據分析/數據可視化
通用機器學習