使用IntelliJ IDEA 編譯開源的機器學習源碼--Oryx

 

What is Oryx?

大名鼎鼎的Sean Owen (http://www.linkedin.com/in/srowen) 正在 Cloudera 做爲 Director of Data Science 專一投身於名爲Oryx的開源機器學習項目當中。(Oryx意思是劍羚,屬於非洲羚羊的一類分支)。若是您讀過《Mahout in Action》這本書,您應該有印象:此書的做者之一就是Sean Owen。git

Oryx的開發意圖在於幫助Hadoop用戶構建機器學習模式並將其加以部署,這樣咱們就可以以實時方式查詢並獲取其結果——例如將其做爲垃圾郵件過濾器或者推薦引擎的組成部分。github

做爲Hadoop當中實現機器學習模式建立的傳統途徑,Apache Mahout "已經走到了發展道路的盡頭。"Owen如是說算法

The Oryx open source project provides simple, real-time large-scale machine learning / predictive analytics infrastructure.機器學習

Architecture

Oryx does two things at heart: builds models, and serves models. These are the responsibilities of two separate components, the Computation Layer and Serving Layer, respectively.ide

 

在 IntelliJ IDEA 中編譯 Oryx 

雖然我是忠實的 Visual Studio 的擁躉(老牌的Windows Phone Developer),可是在工做中不可避免也會遇到 Java 開發的工做,好比目前專一的基於機器學習算法的推薦引擎。對我而言,Eclipse 是生命中不能承受之輕(至少目前爲止是如此),以前基於 Apache Mahout 所作的推薦算法是在 Eclipse 中編碼和生成Jar包,遇到的問題無數。好比在 Eclipse 中導入 無論是 Mahout 仍是 Oryx 的源碼都出現我沒法解決的編譯錯誤。衆所周知 Mahout 和 Oryx 都是基於 Maven 編譯的,而在個人 Eclipse 開發環境中出現的 Maven 編譯錯誤,花費了不少時間查找資料,可是最終仍是無從解決。oop

在得知機器學習領域的大神Sean Owen 使用 IntelliJ IDEA 開發 Oryx ,毅然決然地安裝 IntelliJ IDEA Community Edition ( http://www.jetbrains.com/idea/download/ )。學習

在 Cloudera 的開發者社區 Data Science and Machine Learning 論壇您可發現 Owen 的足跡,耐心地爲開發者解答 Apache Mahout 和 Oryx 的疑問。ui

 

在 Windows 8.1 中啓動 IntelliJ IDEA,打開從 GitHub 下載的 Oryx 開源代碼 (https://github.com/cloudera/oryx ) 。編碼

 

 

在 Oryx Project 上點擊鼠標右鍵,選擇 "Maven" – "Reimport",IntelliJ IDEA 從新導入項目所依賴的 Maven Libraries。idea

 

至此,Oryx 的源碼便可編譯成功,研究之,學習之。

相關文章
相關標籤/搜索