OpenFEA是一站式大數據敏捷分析系統,融合了內存計算、集羣運算、機器學習、交互分析、可視化分析等技術,涵蓋數據收集、數據探索、構建模型、模型發佈等功能,分析性能卓越,使用簡便,無需複雜編程便可快速實現大數據分析,助力數據分析師激揚數據,塑造業務標杆。java
數據收集 正則表達式
OpenFEA可以融合更多類型的數據來進行運算,支持關係型數據源、 Hadoop數據源、數據文件、第三方數據源。算法
支持數據源與接口/格式的雙向自定義機制。表示各類複雜結構或LOAD和STORE各種數據源,都輕鬆無憂。
編程
數據探索 框架
OpenFEA經過交互分析、數據處理、可視化分析等探索性分析手段,能夠快速辨析並挖掘出數據的模式與特色以及規律。機器學習
一、 不似PIG,勝似PIG的分析原語函數
原子輸入,分析結果立等可取工具
二、 強大的數據處理能力oop
正則表達式、Lambda函數、字符處理函數、矢量運算,保證數據的真實性,去除噪音數據。性能
三、 可視化分析
經過獨有的數據透視算法,可分析海量數據,並延續行業專家經過EXCEL分析數據的操做習慣。
模型構建
OpenFEA運用數理統計、機器學習等方法構建分析模型。
一、 數理統計
運行數學統計函數找出數據的內在規律性。
二、 機器學習算法
線性迴歸、非線性迴歸、邏輯迴歸、樸素貝葉斯、支持向量機、決策樹、KNN、Boosting、KMeans聚類、層次聚類、主成份降維分析、Apriori關聯算法、ARIMA時序分析、多維分析、均值漂移聚類、傳播聚類、密度聚類、譜聚類......
三、 用戶自定義框架
基於Python構建,支持用戶自定義、添加模型算法。
發佈模型
OpenFEA經過腳本、集羣運算、調度控制相結合的方式來發布分析模型。
一、 OpenFEA腳本
貫穿整個分析過程,不須要用java、C重寫算法,不須要用R語言、MATLAB等進行數據探索,不需重複分析場景。
二、 集羣運算MR
化大爲小,分而治之。
三、 調度控制
秒級調度,精度更高。
可視化展現
展現方式多種多樣,提供面板設計、交互應用、多級交互等個性化工具。
一、 可視化圖形
不須要接入BI工具,近30 種圖形樣式 , 既能夠經過一個plot原語來生成 也能夠在可視化界面經過手動選擇繪圖而成。
二、 DASHBOARD設計
構建複雜、多維可視化展現界面的必備組件。
三、 交互應用
更關注分析師在數據交互與產品使用過程當中的體驗,實現有效信息的傳遞,達到展現的目的,直觀、易操做、易理解。
四、 深度交互
上彈下鑽,層層鑽取,主從聯動,多屏互動。
分析門戶
OpenFEA不只能實時展示分析結果,並且以人性化爲出發點,強調「以人爲本」,支持用戶以更爲個性化的方式展示大數據。
一、 導航設計
多種形態,搭配方式靈活,千人千面。
二、 用戶自定義導航(UDN)
嵌入第三方頁面,也能夠被第三方嵌入。
三、 門戶模板
四種以上的模板,可直接套用,皮膚切換秒級完成。