當前, 在大數據領域, Java成爲了當仁不讓的必修語言。緣由就是大數據平臺必備的Hadoop分佈式管理平臺須要使用Java,可是這種局面有可能被DARPA改變。html
IT經理網在「大數據成爲美國軍隊的’新型武器’」 一文中,報道過美國國防部下屬的「國防高級研究項目署」(DARPA)經過XDATA項目進行大數據投資的狀況。 最近, DARPA經過XDATA項目的基金投資Continuum Analytics,幫助其開發Python在大數據領域的數據處理和可視化能力。 XDATA這個計劃的目的, 就是研究在對非完美及非完整數據集,進行海量數據處理和數據可視化的算法。 XDATA項目基金總共有1億美圓, 此次DARPA對Continuum Analytics的投資共計3百萬美圓。程序員
Python是一個很是流行的編程語言, 不管在網絡程序員中(好比Google的至關多的產品就是用Python編寫的,Python也是豆瓣的主要開發語言), 仍是在科學計算領域, Python都有很普遍的應用。而Continuum Analytics的目的, 就是要進行下一代數據分析工具的開發, 使得Python在數據分析領域的應用, 如同在科學, 工程和規模化計算方面那樣強大。算法
Continuum Analytics的旗艦產品Anaconda是一個基於Disco平臺的數據管理,分析和可視化的工具。而 Disco是一個最初由諾基亞開發的, 基於Python的分佈式數據管理平臺,能夠做爲以Java爲基礎的Hadoop平臺的替代。編程
參考閱讀:Hadoop過期,大數據泡沫將破裂瀏覽器
Anaconda支持流行的Python科學計算庫如NumPy, SciPy和Pandas等。 此外, Continuum Analytics還推出了一個名爲Wakari的產品, 這是一個基於瀏覽器的數據分析環境。 Continuum Analytics把它描述成爲「科學, 工程和商業數據分析中的WordPress, Github和Youtube。」網絡
而DARPA好像對Continuum Analytics參與的幾個開源項目表現出了特別的興趣。 這些項目包括 Blaze (使用Python代碼在分佈式系統上進行數據分析的技術), Bokeh(一個爲大數據和多維度數據設計的基於HTML5的數據可視化庫),以及Numba(Python編譯器, 能夠將Python代碼編譯成機器碼從而加快計算速度)。編程語言
從DARPA的角度, XDATA項目的目的是研究基於海量數據的高性能計算和可視化。 所以, 像Continuum Analytics這樣具有這樣核心技術的公司, 就理所應當的成爲投資目標。 而鑑於Python在開源社區,科學和工程領域的普遍應用。 經過投資Continuum Analytics, 也能夠極大地擴大大數據分析的使用人羣。同時也能夠增強DARPA和開發者社區的進一步緊密合做來推進大數據分析的發展。分佈式