25個JAVA 機器學習工具包

本列表總結了25個Java機器學習工具&庫:
Weka集成了數據挖掘工做的機器學習算法。這些算法能夠直接應用於一個數據集上或者你能夠本身編寫代碼來調用。Weka包括一系列的工具,如數據預處理、分類、迴歸、聚類、關聯規則以及可視化。
Massive Online Analysis(MOA)是一個面向數據流挖掘的流行開源框架,有着很是活躍的成長社區。它包括一系列的機器學習算法(分類、迴歸、聚類、異常檢測、概念漂移檢測和推薦系統)和評估工具。關聯了WEKA項目,MOA也是用Java編寫的,其擴展性更強。
MEKA項目提供了一個面向多標籤學習和評價方法的開源實現。在多標籤分類中,咱們要預測每一個輸入實例的多個輸出變量。這與「普通」狀況下只涉及一個單一目標變量的情形不一樣。此外,MEKA基於WEKA的機器學習工具包。
Advanced Data mining And Machine learning System(ADAMS)是一種新型的柔性工做流引擎,旨在迅速創建並保持真實世界的複雜知識流,它是基於GPLv3發行的。
Environment for Developing KDD-Applications Supported by Index-Structure(ELKI)是一款基於Java的開源(AGPLv3)數據挖掘軟件。ELKI主要集中於算法研究,重點研究聚類分析中的無監督方法和異常檢測。
Mallet是一個基於Java的面向文本文件的機器學習工具包。Mallet支持分類算法,如最大熵、樸素貝葉斯和決策樹分類。
Encog是一個先進的機器學習框架,集成了支持向量機(SVM)、人工神經網絡、遺傳算法、貝葉斯網絡、隱馬爾可夫模型(HMM)、遺傳編程和遺傳算法。
Datumbox機器學習框架是一個用Java編寫的開源框架,容許快速地開發機器學習和統計應用。該框架的核心重點包括大量的機器學習算法以及統計測試,可以處理中等規模的數據集。
Deeplearning4j是使用Java和Scala編寫的第一個商業級的、開源的、分佈式深刻學習庫。其設計的目的是用於商業環境中,而不是做爲一個研究工具。
Mahout是一個內置算法的機器學習框架。Mahout-Samsara幫助人們建立他們本身的數學,並提供了一些現成的算法實現。
Rapid Miner是德國多特蒙特技術大學開發的。它爲開發者開發應用程序提供了一個GUI(圖形用戶界面)和Java API。它還提供了一些機器學習算法,用來作數據處理、可視化以及建模。
Apache SAMOA是一個機器學習(ML)框架,內嵌面向分佈式流ML算法的編程抽象,而且容許在沒有直接處理底層分佈式流處理引擎(DSPEe,如Apache Storm、Apache S4和Apache samza)複雜性的狀況下,開發新的ML算法。用戶能夠開發分佈式流ML算法,並且能夠在多個DSPEs上執行。
Neuroph經過提供支持建立、訓練和保存神經網絡的Java網絡庫和GUI工具,簡化了神經網絡開發。
Oryx 2是一個創建在Apache Spark和Apache Kafka的Lambda架構實現,但隨着實時大規模機器學習而逐漸開始專業化。這是一個用於構建應用程序的框架,但也包括打包,以及面向協同過濾、分類、迴歸和聚類的端到端的應用程序。
Stanford Classifier是一個機器學習工具,它能夠將數據項歸置到一個類別。一個機率分類器,好比這個,它能夠對一個數據項給出類分配的機率分佈。該軟件是最大熵分類器的一個Java實現。
io是一個Retina API,有着快速精確的相似大腦的天然語言處理算法。
JSAT是一個快速入門的機器學習庫。該庫是我在業餘時間開發的,基於GPL3發行的。庫中的一部份內容可自主學習,例如全部的代碼都是獨立的。JSAT沒有外部依賴,並且是純Java編寫的。
N-Dimensional Arrays for Java(ND4J)是一個用於JVM的科學計算庫。它們是用來在生產環境中使用的,這代表例程的設計是以最小的內存需求來運行的。
Java Machine Learning Library(Java機器學習庫)是一系列機器學習算法的相關實現。這些算法,不管是源代碼仍是文檔,都編寫的很出色。其主要語言是Java。
Java-ML是一個使用Java編寫的一系列機器學習算法的Java API。它只提供了一個標準的算法接口。
MLlib (Spark)是Apache Spark的可擴展機器學習庫。雖然是Java,但該庫與平臺還支持Java,Scala和Python綁定。此庫是最新的,而且算法不少。
H2O是用於智能應用的機器學習API。它在大數據上對統計學、機器學習和數學進行了規模化。H2O可擴展,開發者能夠在覈心部分使用簡單的數學知識。
WalnutiQ是人腦部分面向對象模型,有着理論經常使用的學習算法(正在向簡單強烈的情感人工智能模型方向研究)。
RankLib是一個排名學習算法庫。目前已經實現八種流行的算法。
htm.java(基於Java的Hierarchical Temporal Memory算法實現)是一個面向智能計算的Numenta平臺的Java接口。源碼java

相關文章
相關標籤/搜索