機器學習與視覺訓練的相關框架

1、Matlab計算機視覺
Contourlets—實現輪廓波變換及其使用函數的MATLAB源代碼
Shearlets—剪切波變換的MATLAB源碼
Curvelets—Curvelet變換的MATLAB源碼(Curvelet變換是對小波變換向更高維的推廣,用來在不一樣尺度角度表示圖像)
Bandlets—Bandlets變換的MATLAB源碼
天然語言處理
NLP—一個Matlab的NLP庫
通用機器學習
Training a deep autoencoder or a classifier on MNIST digits—在MNIST字符數據集上訓練一個深度的Autoencoder或分類器[深度學習]
t-Distributed Stochastic Neighbor Embedding—獲獎的降維技術,特別適合於高維數據集的可視化
Spider—Matlab機器學習的完整面向對象環境
LibSVM—支持向量機程序庫
LibLinear—大型線性分類程序庫
Machine Learning Module—M·A·Girolami教授的機器學習課程,包括PDF、講義及代碼
Caffe—考慮了代碼清潔、可讀性及速度的深度學習框架
Pattern Recognition Toolbox—Matlab中的模式識別工具包,徹底面向對象
數據分析/數據可視化
matlab_gbl—處理圖像的Matlab包
gamic—圖像算法純Matlab高效實現,對MatlabBGL的mex函數是個補充


2、.NET計算機視覺
OpenCVDotNet—包裝器,使.NET程序能使用OpenCV代碼
Emgu CV—跨平臺的包裝器,能在Windows、Linus、Mac OS X、iOS和Android上編譯
天然語言處理
Stanford.NLP for .NET—斯坦福大學NLP包在.NET上的徹底移植,還可做爲NuGet包進行預編譯
通用機器學習
Accord.MachineLearning—支持向量機、決策樹、樸素貝葉斯模型、K-means、高斯混合模型和機器學習應用的通用算法,例如:隨機抽樣一致性算法、交叉驗證、網格搜索;這個包是Accord.NET框架的一部分
Vulpes—F#語言實現的Deep belief和深度學習包,它在Alea.cuBase下利用CUDA GPU來執行
Encog—先進的神經網絡和機器學習框架,包括用來建立多種網絡的類,也支持神經網絡須要的數據規則化及處理的類;它的訓練採用多線程彈性傳播;它也能使用GPU加快處理時間;它提供了圖形化界面來幫助建模和訓練神經網絡
Neural Network Designer—這是一個數據庫管理系統和神經網絡設計器;設計器用WPF開發,也是一個UI,你能夠設計你的神經網絡、查詢網絡、建立並配置聊天機器人,它能問問題,並從你的反饋中學習;這些機器人甚至能夠從網絡蒐集信息用來輸出,或是用來學習
數據分析/數據可視化
numl—numl這個機器學習庫,目標就是簡化預測和聚類的標準建模技術
Math.NET Numerics— Math.NET項目的數值計算基礎,着眼提供科學、工程以及平常數值計算的方法和算法;支持 Windows、Linux和Mac上的 .Net 4.0、.Net 3.5和Mono、Silverlight 五、Windows Phone/SL 八、Windows Phone 8.1以及裝有PCL Portable Profiles 47及344的Windows 8,裝有Xamarin的Android/iOS
Sho— Sho是數據分析和科學計算的交互式環境,可讓你將腳本(IronPython語言)和編譯的代碼(.NET)無縫鏈接,以快速靈活的創建原型;這個環境包括強大高效的庫,如線性代數、數據可視化,可供任何.NET語言使用,還爲快速開發提供了功能豐富的交互式shell


3、Python計算機視覺
SimpleCV—開源的計算機視覺框架,能夠訪問如OpenCV等高性能計算機視覺庫;使用Python編寫,能夠在Mac、Windows以及Ubuntu上運行
天然語言處理
NLTK—一個領先的平臺,用來編寫處理人類語言數據的Python程序
Pattern—Python可用的web挖掘模塊,包括天然語言處理、機器學習等工具
TextBlob—爲普通天然語言處理任務提供一致的API,以NLTK和Pattern爲基礎,並和二者都能很好兼容
jieba—中文斷詞工具
SnowNLP—中文文本處理庫
loso—另外一箇中文斷詞庫
genius—基於條件隨機域的中文斷詞庫
nut—天然語言理解工具包
通用機器學習
Bayesian Methods for Hackers—Python語言機率規劃的電子書
MLlib in Apache Spark—Spark下的分佈式機器學習庫
scikit-learn—基於SciPy的機器學習模塊
graphlab-create—包含多種機器學習模塊的庫(迴歸、聚類、推薦系統、圖分析等),基於能夠磁盤存儲的DataFrame
BigML—鏈接外部服務器的庫
pattern—Python的web挖掘模塊
NuPIC—Numenta公司的智能計算平臺
Pylearn2—基於Theano的機器學習庫
hebel—Python編寫的使用GPU加速的深度學習庫
gensim—主題建模工具
PyBrain—另外一個機器學習庫
Crab—可擴展的、快速推薦引擎
python-recsys—Python實現的推薦系統
thinking bayes—關於貝葉斯分析的書籍
Restricted Boltzmann Machines—Python實現的受限波爾茲曼機。[深度學習]
Bolt—在線學習工具箱
CoverTree—Cover tree的Python實現,SciPy、spatial、KDTree便捷的替代
nilearn—Python實現的神經影像學機器學習庫
Shogun—機器學習工具箱
Pyevolve—遺傳算法框架
Caffe—考慮了代碼清潔、可讀性及速度的深度學習框架
breze—深度及遞歸神經網絡的程序庫,基於Theano
數據分析/數據可視化
SciPy—基於Python的數學、科學、工程開源軟件生態系統
NumPy—Python科學計算基礎包
Numba—Python的低級虛擬機JIT編譯器,Cython和NumPy的開發者編寫,供科學計算使用
NetworkX—爲複雜網絡使用的高效軟件
Pandas—這個庫提供了高性能、易用的數據結構及數據分析工具
Open Mining—Python中的商業智能工具(Pandas web接口)
PyMC—MCMC採樣工具包
zipline—Python的算法交易庫
PyDy—全名Python Dynamics,協助基於NumPy、SciPy、iPython以及matplotlib的動態建模工做流
SymPy—符號數學Python庫
statsmodels—Python的統計建模及計量經濟學庫
astropy—Python天文學程序庫,社區協做編寫
matplotlib—Python的2D繪圖庫
bokeh—Python的交互式Web繪圖庫
plotly—Python和matplotlib的協做web繪圖庫
vincent—將Python數據結構轉換爲Vega可視化語法
d3py—Python的繪圖庫,基於D3.js
ggplot—和R語言裏的ggplot2提供一樣的API
Kartograph.py—Python中渲染SVG圖的庫,效果漂亮
pygal—Python下的SVG圖表生成器
pycascading
雜項腳本/iPython筆記/代碼庫
pattern_classification
thinking stats 2
hyperopt
numpic
2012-paper-diginorm
ipython-notebooks
decision-weights
Sarah Palin LDA—Sarah Palin關於主題建模的電郵
Diffusion Segmentation—基於擴散方法的圖像分割算法集合
Scipy Tutorials—SciPy教程,已過期,請查看scipy-lecture-notes
Crab—Python的推薦引擎庫
BayesPy—Python中的貝葉斯推斷工具
scikit-learn tutorials—scikit-learn學習筆記系列
sentiment-analyzer—推特情緒分析器
group-lasso—座標降低算法實驗,應用於(稀疏)羣套索模型
mne-python-notebooks—使用 mne-python進行EEG/MEG數據處理的iPython筆記
pandas cookbook—使用Python pandas庫的方法書
climin—機器學習的優化程序庫,用Python實現了梯度降低、LBFGS、RMSprop、adadelta 等算法


4、R通用機器學習
Clever Algorithms For Machine Learning
Machine Learning For Hackers 
Machine Learning Task View on CRAN—R語言機器學習包列表,按算法類型分組
caret—R語言150個機器學習算法的統一接口
SuperLearner and subsemble—該包集合了多種機器學習算法
Introduction to Statistical Learning
數據分析/數據可視化
Learning Statistics Using R 
ggplot2—基於圖形語法的數據可視化包


5、Ruby天然語言處理
Treat—文本檢索與註釋工具包,Ruby上見過的最全面的工具包
Ruby Linguistics—這個框架能夠用任何語言爲Ruby對象構建語言學工具;它包括一個語言無關的通用前端,一個將語言代碼映射到語言名的模塊,以及一個含有不少英文語言工具的模塊
Stemmer—使得Ruby可用 libstemmer_c中的接口
Ruby Wordnet—WordNet的Ruby接口庫
Raspel—aspell綁定到Ruby的接口
UEA Stemmer—UEALite Stemmer的Ruby移植版,供搜索和檢索用的保守的詞幹分析器
Twitter-text-rb—該程序庫能夠將推特中的用戶名、列表和話題標籤自動鏈接並提取出來
通用機器學習
Ruby Machine Learning—Ruby實現的一些機器學習算法
Machine Learning Ruby
jRuby Mahout—精華!在JRuby世界中釋放了Apache Mahout的威力
CardMagic-Classifier—可用貝葉斯及其餘分類法的通用分類器模塊
Neural Networks and Deep Learning—《神經網絡和深度學習》一書的示例代碼
數據分析/數據可視化
rsruby—Ruby – R bridge
data-visualization-ruby—關於數據可視化的Ruby Manor演示的源代碼和支持內容
ruby-plot —將Gnuplot包裝爲Ruby形式,特別適合將ROC曲線轉化爲SVG文件
plot-rb—基於Vega和D3的ruby繪圖庫
scruffy—Ruby下出色的圖形工具包大聖衆包威客平臺(http://www.dashengzb.cn/
SciRuby
Glean—數據管理工具
Bioruby
Arel
Misc 
雜項
Big Data For Chimps—大數據處理嚴肅而有趣的指南書


6、Scala天然語言處理
ScalaNLP—機器學習和數值計算庫的套裝
Breeze—Scala用的數值處理庫
Chalk—天然語言處理庫
FACTORIE—可部署的機率建模工具包,用Scala實現的軟件庫;爲用戶提供簡潔的語言來建立關係因素圖,評估參數並進行推斷
通用機器學習
Conjecture—Scalding下可擴展的機器學習框架
brushfire—Scalding下的決策樹工具
ganitha—基於Scalding的機器學習程序庫
adam—使用Apache Avro、Apache Spark和Parquet的基因組處理引擎,有專用的文件格式,Apache 2軟件許可
bioscala—Scala語言可用的生物信息學程序庫
BIDMach—機器學習CPU和GPU加速庫
數據分析/數據可視化
MLlib in Apache Spark—Spark下的分佈式機器學習庫
Scalding—CAscading的Scala接口
Summing Bird—用Scalding和Storm進行Streaming MapReduce
Algebird—Scala的抽象代數工具
xerial—Scala的數據管理工具
simmer—化簡你的數據,進行代數聚合的unix過濾器
PredictionIO—供軟件開發者和數據工程師用的機器學習服務器
BIDMat—支持大規模探索性數據分析的CPU和GPU加速矩陣庫前端

相關文章
相關標籤/搜索