15款頂級的開源人工智能工具推薦

導讀 這些開源人工智能應用軟件處在人工智能研究領域的最前沿;人工智能是技術研究領域最煊赫一時的領域之一。IBM、谷歌、微軟、Facebook和亞馬遜等公司正投入巨資進行研發,並紛紛收購在機器學習、神經網絡、神經語言和圖像處理等領域取得進展的初創公司。

15款頂級的開源人工智能工具推薦15款頂級的開源人工智能工具推薦

考慮到人工智能如此受關注,斯坦福大學的專家最近撰寫的一份智能研究報告得出結論:「如今到2030年人工智能可能會出現愈來愈有用的應用,有可能給咱們的社會和經濟帶來深遠的積極影響,」也就不足爲奇了。此文着重介紹15個知名度最大的開源人工智能項目。html

1.Caffelinux

Caffe是加州大學伯克利分校攻讀博士學位者的傑做,這是一種深度學習框架,基於表達式架構和可擴展代碼。速度快是它賴以成名的特色,於是在研究人員和企業用戶當中都備受歡迎。據官方網站聲稱,僅僅使用一個英偉達K40 GPU,它在短短一天內就可以處理6000多萬個圖像。它由伯克利視覺和學習中心(BVLC)管理,英偉達和亞馬遜等公司提供了撥款,支持它的發展。算法

相關連接:http://caffe.berkeleyvision.orgapache

2.CNTK編程

CNTK的全稱是計算網絡工具包,它是微軟的開源人工智能工具之一。它聲稱擁有出衆的性能,不管在只有一個CPU的系統上運行,仍是在擁有多個GPU的多臺機器上運行,都是如此。微軟主要用它來研究語音識別,可是它一樣適用於其餘應用領域,好比機器翻譯、圖像識別、圖像字幕、文本處理、語言理解和語言建模。網絡

相關連接:https://www.cntk.ai架構

3.Deeplearning4j框架

Deeplearning4j是一種面向Java虛擬機(JVM)的開源深度學習庫。它在分佈式環境中運行,可與Hadoop和Apache Spark整合起來。它讓用戶能夠配置深度神經網絡,與Java、Scala及其餘JVM語言兼容。機器學習

該項目由一家名爲Skymind的商業公司管理,該公司提供收費的支持、培訓和Deeplearning4j的企業發行版。分佈式

相關連接:http://deeplearning4j.org

4.分佈式機器學習工具包

與CNTK同樣,分佈式機器學習工具包(DMTK)是微軟的開源人工智能工具之一。它是爲大數據應用領域設計,旨在更快地訓練人工智能系統。它包括三大部分:DMTK框架、LightLDA主題模型算法以及分佈式(Multisense)單詞嵌入算法。微軟聲稱,在8個集羣機器上,它可以「針對擁有1000多億個權標的文檔集合,訓練擁有100萬個主題和1000萬個單詞詞彙表(共有10萬億個參數)的主題模型,」這個成績是其餘工具沒法比擬的,這也證實了DMTK的速度有多快。

相關連接:http://www.dmtk.io

5.H2O

H2O更加專一於人工智能在企業領域的應用,而不是在研究領域的應用,它的用戶包括諸多大公司:第一資本、思科、尼爾森Catalina、貝寶及Transamerica。它聲稱讓任何人均可以使用機器學習和預測分析的強大功能,解決業務問題。它可用於預測建模、風險及欺詐分析、保險分析、廣告技術、醫療保健和客戶情報。

它有兩種開源版本:標準的H2O和Sparkling Water,後者與Apache Spark集成起來。它還提供收費的企業支持。

相關連接:http://www.h2o.ai

6. Mahout

Mahout是Apache基金會下面的一個項目,是一種開源機器學習框架。據官方網站聲稱,它提供三種主要的特性:用於構建可擴展算法的編程環境、面向Spark和H2O等工具的預製算法,以及名爲Samsara的向量數學試驗環境。使用Mahout的公司包括:Adobe、埃森哲、Foursquare、英特爾、領英、推特、雅虎及其餘許多公司。可經過官方網站上所列的第三方得到專業支持。

相關連接:http://mahout.apache.org

7.MLlib

Apache Spark以速度快著稱,它已成爲最流行的大數據處理工具之一。MLlib是Spark的可擴展機器學習庫。它與Hadoop整合起來,可與NumPy和R協同操做。它包括一大批機器學習算法,可用於分類、迴歸、決策樹、推薦、聚類、主題建模、特性轉換、模型評估、機器學習管道構建、機器學習持久性、生存分析、頻繁項集、順序模式挖掘、分佈式線性代數和統計。

相關連接:https://spark.apache.org/mllib/

8.NuPIC

NuPIC由一家名爲Numenta的公司管理,這是一種開源人工智能項目,基於一種名爲分層式即時記憶(即HTM)的理論。實際上,HTM試圖創建一種模仿人類大腦新皮層而建的計算機系統。目的在於製造「處理許多認知任務時接近或賽過人類表現」的機器。

除了開源許可證外,Numenta還提供採用商業許可證的NuPic,它還提供做爲它技術底層的專利方面的許可證。

相關連接:http://numenta.org

9.OpenNN

OpenNN爲深刻了解人工智能的研究人員和開發人員而設計,這是一種用於實現神經網絡的C++編程庫。主要特性包括:深度架構和卓越性能。官方網站上有全面的說明文檔,包括解釋神經網絡基礎知識的入門教程。可經過Artelnics得到OpenNN的收費支持,總部位於西班牙的這家公司主攻預測分析。

相關連接:http://www.opennn.net

10.OpenCyc

OpenCyc由一家名爲Cycorp的公司開發,它讓用戶能夠訪問Cyc知識庫和常識推理引擎。它包括239000多個術語、約2093000個三元組以及大約69000個owl:sameAs連接(指向外部語義數據命名空間)。它用於豐富域名建模、語義數據整合、文本理解、特定領域專家系統和遊戲人工智能。這家公司還提供Cyc的另外兩個版本:一個是非開源免費版本,面向研究人員;另外一個面向企業用戶,須要收費。

相關連接:http://www.cyc.com/platform/opencyc/

11.Oryx 2

Oryx 2創建在Apache Spark和Kafka上,這是一種專門的應用開發框架,面向大規模的機器學習。它使用了一種獨特的lambda架構,有三個層次。開發人員可以使用Oryx 2來構建新的應用程序,它還包括一些預製應用程序,處理常見的大數據任務,好比協做過濾、分類、迴歸和聚類。大數據工具廠商Cloudera創建了最初的Oryx 1項目,一直大力參與持續開發工做。

相關連接:http://oryx.io

12.PredictionIO

今年2月份,Salesforce收購了PredictionIO,後來在7月份, 它把該平臺連同商標一塊兒捐獻給了Apache基金會,該基金會將它列爲孵化器項目。因此,雖然Salesforce使用PredictionIO技術來完善本身的機器學習功能,可是開源版本方面的工做也會繼續下去。它能夠幫助用戶構建擁有機器學習功能的預測引擎,這些功能可用來部署實時響應動態查詢的Web服務。

相關連接:https://prediction.io

13.SystemML

SystemML最初由IBM開發,如今它是Apache旗下的一個大數據項目。它提供了一種高度可擴展的平臺,能夠實施用R或相似Python的語法編寫的高級運算和算法。企業已經在用它來跟蹤汽車維修方面的客戶服務,引導機場客流量,或者將社交媒體數據與銀行客戶聯繫起來。它能夠在Spark或Hadoop上運行。

相關連接:http://systemml.apache.org

14.TensorFlow

TensorFlow是谷歌的開源人工智能工具之一。它提供了用於數字計算的庫,使用數據流圖。它能夠在衆多不一樣的搭載單一或多個CPU和GPU的系統上運行,甚至能夠在移動設備上運行。它擁有深度靈活性、真正的可移植性、自動差分功能,並支持Python和C++。官方網站上列有很是豐富的教程和實用文章,可供有興趣使用或擴展其功能的開發人員或研究人員使用。

相關連接:https://www.tensorflow.org

15.Torch

Torch自稱是「一種科學計算框架,普遍支持把GPU放在首位的機器學習算法。」這裏的重點在於靈活性和速度。此外,很容易與衆多方面的軟件包結合使用:機器學習、計算機視覺、信號處理、並行處理、圖像、視頻、音頻和網絡。它依賴一種名爲LuaJIT的腳本語言,這種語言基於Lua。

相關連接:http://torch.ch

原文來自:http://os.51cto.com/art/201609/517610.htm

本文地址:http://www.linuxprobe.com/15-open-source-arti-intelli.html

相關文章
相關標籤/搜索