機器學習資源大全

 


通用機器學習
javascript

  • MLlib in Apache Spark—Spark中的分佈式機器學習程序庫
  • Mahout —分佈式的機器學習庫
  • Stanford Classifier —斯坦福大學的分類器
  • Weka—Weka是數據挖掘方面的機器學習算法集。
  • ORYX—提供一個簡單的大規模實時機器學習/預測分析基礎架構。

數據分析/數據可視化html

  • Hadoop—大數據分析平臺
  • Spark—快速通用的大規模數據處理引擎。
  • Impala —爲Hadoop實現實時查詢

Javascript天然語言處理java

  • Twitter-text-js —JavaScript實現的推特文本處理庫
  • NLP.js —javascript及coffeescript編寫的NLP工具
  • natural—Node下的通用NLP工具
  • Knwl.js—JS編寫的天然語言處理器

數據分析/數據可視化node


通用機器學習
python

  • Convnet.js—訓練深度學習模型的JavaScript庫。
  • Clustering.js—用JavaScript實現的聚類算法,供Node.js及瀏覽器使用。
  • Decision Trees—Node.js實現的決策樹,使用ID3算法。
  • Node-fann —Node.js下的快速人工神經網絡庫。
  • Kmeans.js—k-means算法的簡單Javascript實現,供Node.js及瀏覽器使用。
  • LDA.js —供Node.js用的LDA主題建模工具。
  • Learning.js—邏輯迴歸/c4.5決策樹的JavaScript實現
  • Machine Learning—Node.js的機器學習庫。
  • Node-SVM—Node.js的支持向量機
  • Brain —JavaScript實現的神經網絡
  • Bayesian-Bandit —貝葉斯強盜算法的實現,供Node.js及瀏覽器使用。

Julia通用機器學習git

  • PGM—Julia實現的機率圖模型框架。
  • DA—Julia實現的正則化判別分析包。
  • Regression—迴歸分析算法包(如線性迴歸和邏輯迴歸)。
  • Local Regression —局部迴歸,很是平滑!
  • Naive Bayes —樸素貝葉斯的簡單Julia實現
  • Mixed Models —(統計)混合效應模型的Julia包
  • Simple MCMC —Julia實現的基本mcmc採樣器
  • Distance—Julia實現的距離評估模塊
  • Decision Tree —決策樹分類器及迴歸分析器
  • Neural —Julia實現的神經網絡
  • MCMC —Julia下的MCMC工具
  • GLM —Julia寫的廣義線性模型包
  • Online Learning
  • GLMNet —GMLNet的Julia包裝版,適合套索/彈性網模型。
  • Clustering—數據聚類的基本函數:k-means, dp-means等。
  • SVM—Julia下的支持向量機。
  • Kernal Density—Julia下的核密度估計器
  • Dimensionality Reduction—降維算法
  • NMF —Julia下的非負矩陣分解包
  • ANN—Julia實現的神經網絡

天然語言處理github

數據分析/數據可視化web

雜項/演示文稿算法

Lua
通用機器學習
apache

  • Torch7
    • cephes —Cephes數學函數庫,包裝成Torch可用形式。提供幷包裝了超過180個特殊的數學函數,由Stephen L. Moshier開發,是SciPy的核心,應用於不少場合。
    • graph —供Torch使用的圖形包。
    • randomkit—從Numpy提取的隨機數生成包,包裝成Torch可用形式。
    • signal —Torch-7可用的信號處理工具包,可進行FFT, DCT, Hilbert, cepstrums, stft等變換。
    • nn —Torch可用的神經網絡包。
    • nngraph —爲nn庫提供圖形計算能力。
    • nnx—一個不穩定實驗性的包,擴展Torch內置的nn庫。
    • optim—Torch可用的優化算法庫,包括 SGD, Adagrad, 共軛梯度算法, LBFGS, RProp等算法。
    • unsup—Torch下的非監督學習包。提供的模塊與nn(LinearPsd, ConvPsd, AutoEncoder, …)及獨立算法 (k-means, PCA)等兼容。
    • manifold—操做流形的包。
    • svm—Torch的支持向量機庫。
    • lbfgs—將liblbfgs包裝爲FFI接口。
    • vowpalwabbit —老版的vowpalwabbit對torch的接口。
    • OpenGM—OpenGM是C++編寫的圖形建模及推斷庫,該binding能夠用Lua以簡單的方式描述圖形,而後用OpenGM優化。
    • sphagetti —MichaelMathieu爲torch7編寫的稀疏線性模塊。
    • LuaSHKit —將局部敏感哈希庫SHKit包裝成lua可用形式。
    • kernel smoothing —KNN、核權平均以及局部線性迴歸平滑器
    • cutorch—torch的CUDA後端實現
    • cunn —torch的CUDA神經網絡實現。
    • imgraph—torch的圖像/圖形庫,提供從圖像建立圖形、分割、創建樹、又轉化回圖像的例程
    • videograph—torch的視頻/圖形庫,提供從視頻建立圖形、分割、創建樹、又轉化回視頻的例程
    • saliency —積分圖像的代碼和工具,用來從快速積分直方圖中尋找興趣點。
    • stitch —使用hugin拼合圖像並將其生成視頻序列。
    • sfm—運動場景束調整/結構包
    • fex —torch的特徵提取包,提供SIFT和dSIFT模塊。
    • OverFeat—當前最高水準的通用密度特徵提取器。
  • Numeric Lua
  • Lunatic Python
  • SciLua
  • Lua – Numerical Algorithms
  • Lunum

演示及腳本

    • Core torch7 demos repository.核心torch7演示程序庫
      • 線性迴歸、邏輯迴歸
      • 人臉檢測(訓練和檢測是獨立的演示)
      • 基於mst的斷詞器
      • train-a-digit-classifier
      • train-autoencoder
      • optical flow demo
      • train-on-housenumbers
      • train-on-cifar
      • tracking with deep nets
      • kinect demo
      • 濾波可視化
      • saliency-networks
    • Training a Convnet for the Galaxy-Zoo Kaggle challenge(CUDA demo)
    • Music Tagging—torch7下的音樂標籤腳本
    • torch-datasets 讀取幾個流行的數據集的腳本,包括:
      • BSR 500
      • CIFAR-10
      • COIL
      • Street View House Numbers
      • MNIST
      • NORB
    • Atari2600 —在Arcade Learning Environment模擬器中用靜態幀生成數據集的腳本。

 

 

轉自:基因堂
2. http://www.cnblogs.com/PurpleTide/p/3769748.html

3. 好文:http://blog.csdn.net/wiking__acm/article/details/42742961

相關文章
相關標籤/搜索