大名鼎鼎的Sean Owen (http://www.linkedin.com/in/srowen) 正在 Cloudera 做爲 Director of Data Science 專一投身於名爲Oryx的開源機器學習項目當中。(Oryx意思是劍羚,屬於非洲羚羊的一類分支)。若是您讀過《Mahout in Action》這本書,您應該有印象:此書的做者之一就是Sean Owen。git
Oryx的開發意圖在於幫助Hadoop用戶構建機器學習模式並將其加以部署,這樣咱們就可以以實時方式查詢並獲取其結果——例如將其做爲垃圾郵件過濾器或者推薦引擎的組成部分。github
做爲Hadoop當中實現機器學習模式建立的傳統途徑,Apache Mahout "已經走到了發展道路的盡頭。"Owen如是說。 算法
The Oryx open source project provides simple, real-time large-scale machine learning / predictive analytics infrastructure.機器學習
Oryx does two things at heart: builds models, and serves models. These are the responsibilities of two separate components, the Computation Layer and Serving Layer, respectively.ide
雖然我是忠實的 Visual Studio 的擁躉(老牌的Windows Phone Developer),可是在工做中不可避免也會遇到 Java 開發的工做,好比目前專一的基於機器學習算法的推薦引擎。對我而言,Eclipse 是生命中不能承受之輕(至少目前爲止是如此),以前基於 Apache Mahout 所作的推薦算法是在 Eclipse 中編碼和生成Jar包,遇到的問題無數。好比在 Eclipse 中導入 無論是 Mahout 仍是 Oryx 的源碼都出現我沒法解決的編譯錯誤。衆所周知 Mahout 和 Oryx 都是基於 Maven 編譯的,而在個人 Eclipse 開發環境中出現的 Maven 編譯錯誤,花費了不少時間查找資料,可是最終仍是無從解決。oop
在得知機器學習領域的大神Sean Owen 使用 IntelliJ IDEA 開發 Oryx ,毅然決然地安裝 IntelliJ IDEA Community Edition ( http://www.jetbrains.com/idea/download/ )。學習
在 Cloudera 的開發者社區 Data Science and Machine Learning 論壇您可發現 Owen 的足跡,耐心地爲開發者解答 Apache Mahout 和 Oryx 的疑問。ui
在 Windows 8.1 中啓動 IntelliJ IDEA,打開從 GitHub 下載的 Oryx 開源代碼 (https://github.com/cloudera/oryx ) 。編碼
在 Oryx Project 上點擊鼠標右鍵,選擇 "Maven" – "Reimport",IntelliJ IDEA 從新導入項目所依賴的 Maven Libraries。idea
至此,Oryx 的源碼便可編譯成功,研究之,學習之。