摘要:現現在,擁有深度學習和機器學習領域的技術是科技界的趨勢之一,而且企業則但願僱傭一些擁有良好的機器學習知識背景的程序開發工程師。本文將介紹一些目前流行的、強大的基於Java的機器學習庫,但願給你們帶來幫助。算法
事實上,Java已經成爲開發新的機器學習算法的標準語言。學習Java語言有不少好處,而且在機器學習社區中也被人們所普遍接受,其優勢包括:易維護、商業化、可讀性、可移植性等等。根據2018年6月的編程語言排行榜TIOBE-index提供的數據顯示,Java是目前最流行和使用最普遍的計算機編程語言,包括PHP、C語言、C++、Python和JavaScript等。若是企業想將機器學習業務整合到現有的Java商業應用程序中,那麼就必須僱用Java開發人員。數據庫
下面咱們將列出一些在現有的一些Java應用程序中實現機器學習的最佳類庫。全部的這些庫都是經過各類博客、網站和論壇的流行程度來編寫的。編程
這個機器學習庫是專門爲Java設計的,它是爲開發深度學習算法提供了普遍支持的計算機框架。當涉及到機器學習領域時,Deeplearning4j被認爲是Java的最傑出的貢獻者之一,它是一個開源的深度學習庫,爲各類商業環境同時帶來深度神經網絡和強化深度學習。它一般還能夠做爲Java的DIY工具,並且還具備應對全部那些無限制的虛擬併發任務的能力。網絡
另外,該庫對於識別語音、文字和聲音中的情緒和模式是頗有幫助的。它也能夠用於發現時間序列數據中的異常,如財務數據,都清楚地代表它能夠用於實際的商業場景而不是單純做爲一個研究工具。併發
ELKI表明了開發KDD應用程序的環境,KDD應用是由索引結構支持的,它是另外一個由Java開發的用於數據挖掘的開源機器學習庫。ELKI是專門爲研究人員和學生設計的,它提供了大量的可詳細配置的算法參數。框架
ELKI主要是由正在尋求創建一些相關的數據庫的院校研究生使用的,它的目的是開發和評估高級的數據挖掘算法及其與數據庫索引結構的合做和交互。使用ELKI的Java開發人員可使用任意的數據類型、文件格式等等。機器學習
JavaML是一個擁有大量機器學習的和數據挖掘的算法的Java類庫,它是由科研工做人員和Java開發者共同開發的。這個庫不含有GUI,但它爲每一個類型的算法提供了清晰的接口。當咱們比較JavaML與其它的聚類算法時,就會發現它是很是的簡單直接,而且提供給任何新算法的簡單實現。更多的狀況下,這些算法的實現是須要簡單明瞭的程度代碼和添加適當的註釋,所以它能夠做爲一個很好的參考。這個庫是用Java開發的。編程語言
JSAT提供的是Java統計分析工具,是基於Java開發的用於解決機器學習問題的庫,它能夠在GPL3許可下使用,它的全部源代碼都是包含在內的,沒有任何外部依賴關係。JSAT擁有一個庫中最大的機器學習算法集合,並被認爲是運行最快的Java機器學習庫之一,提供了高效性和靈活性。該庫中的全部機器學習算法都是使用面向對象的框架來實現的。工具
MALLET庫是用於機器學習的語言工具包,它是Java源代碼的合集,可應用的領域包括統計NLP、主題建模、聚類分析、文檔分類和各類其它用於文本的機器學習應用。MALLET也能夠被稱爲用於文本的Java機器學習工具包,它是由馬薩諸塞大學和賓夕法尼亞大學的學生開發的,併爲那些諸如決策樹、樸素貝葉斯和最大熵模型等各類算法提供支持。性能
Mahout是一個機器學習框架,帶有集成的機器學習算法,能幫助開發人員建立本身的算法實現程序。Mahout仍是一個代數相關的框架,被設計用來幫助數據科學工做者、數學工做者和分析人員運行本身的算法。這個機器學習庫是可擴展的,並提供了豐富的組件集,容許你開發一個適用於各類機器學習算法的定製推薦系統。Mahout提供了高性能、靈活性和可擴展性,同時也是爲商業化用途所設計的。
Weka是另外一個很是流行的基於Java的機器學習庫,能夠用於數據挖掘和數據分析工做,其中能夠將算法直接應用到一個數據集,或者使用Java源代碼本身建立新的算法。這個Java庫包含了許多的工具,如:迴歸、聚類、分類和可視化等等。該庫不只是免費的,並且還便於使用,支持特徵選擇、異常檢測、時間序列預測等等。Weka的全稱是懷卡託智能分析環境(Waikato Environment for Knowledge Analysis),它能夠被定義爲用於預測建模和數據分析以及圖形用戶界面(GUI)的算法和工具的集合。
在過去的幾年中,機器學習領域有了新的趨勢。事實上,上述大多數的庫都是開源的,這就意味着開發者能夠很容易地掌握機器學習的開發能力和獲取到相關的技術信息,而且全部的開發者都必須得考慮利用這些庫均可以作些什麼。基於Java的機器學習技術將完全改變應用程序的工做模式。
本文轉載自:https://blog.csdn.net/j2IaYU7Y/article/details/81916842