Prophecis 一站式雲原生機器學習平臺微信
Prophecis 是微衆銀行自研大數據平臺套件 WeDataSphere 的核心應用工具之一,爲用戶提供了全棧的機器學習應用開發與部署解決方案。做爲WeDataSphere 功能工具應用系統,Prophecis 不只和已經開源的產品DataSphere Studio、Linkis無縫對接,同時也能夠獨立運行。
架構
Prophecis Github地址:app
https://github.com/WeBankFinTech/Prophecis框架
*詳情可點擊文末閱讀原文運維
01機器學習
Prophecis是什麼分佈式
Prophecis 是微衆銀行大數據平臺團隊開發的一站式機器學習平臺,其採用雲原生技術方案,提供生產環境全棧化容器部署與管理服務,致力於打通機器學習建模的整個生命週期的Pipeline。Prophecis提供多種模型訓練調試方式,集成多種開源機器學習框架,具有機器學習計算集羣的多租戶管理能力。
02
爲何須要Prophecis
數據接入,數據是一切得以實現的前提。最簡單的方式是經過上傳來解決。企業內部每每會基於大數據平臺,經過數據導入等方式接入。或者經過數據映射的方式,數據不須要導入,直接就能夠經過外部訪問;
開發環境,數據科學家基本對此達成了共識,都會選擇相似 Jupyter 這樣的工具;
分佈式訓練,相似Tensorflow、PyTorch 等都提供一些方法能夠作分佈式訓練;
模型管理,這是如今比較個性化的模塊,不一樣的公司會有不一樣的實現。明略科技的模型管理是涵蓋模型生成、模型部署以及更新迭代的全流程實現。
03
Prophecis總體架構
-
Prophecis Machine Learning Flow:機器學習分佈式建模工具,具有單機和分佈式模式模型訓練能力,支持Tensorflow、Pytorch、XGBoost等多種機器學習框架,支持從機器學習建模到部署的完整Pipeline; -
Prophecis MLLabis:機器學習開發探索工具,提供開發探索服務,是一款基於Jupyter Lab的在線IDE,同時支持GPU及Hadoop集羣的機器學習建模任務,支持Python、R、Julia多種語言,集成Debug、TensorBoard多種插件; -
Prophecis Model Factory:機器學習模型工廠,提供機器學習模型存儲、模型部署測試、模型管理等服務; -
Prophecis Data Factory:機器學習數據工廠,提供特徵工程工具、數據標註工具和物料管理等服務; -
Prophecis Application Factory:機器學習應用工廠,由微衆銀行大數據平臺團隊和AI部門聯合共建,基於青雲(QingCloud)開源的KubeSphere定製開發,提供CI/CD和DevOps工具,GPU集羣的監控及告警能力。
04
Prophecis核心特徵
-
全生命週期的機器學習體驗:Prophecis的Machine Learning Flow 經過 AppJoint 能夠接入到 DataSphere Stdudio 的工做流中,支持從數據上傳、數據預處理、特徵工程、模型訓練、模型評估到模型發佈的機器學習全流程; -
一鍵式的模型部署服務:Prophecis MF 支持將Prophecis Machine Learning Flow、Prophecis MLLabis 生成的訓練模型一鍵式發佈爲 Restful API 或者 RPC 接口,實現模型到業務的無縫銜接; -
機器學習應用部署、運維、實驗的綜合管理平臺:基於社區開源方案定製,提供完整的、可靠的、高度靈活的企業級機器學習應用發佈、監控、服務治理、日誌收集和查詢等管理工具,全方位實現對機器學習應用的管控,知足企業對於機器學習應用在線上生產環境的全部工做要求。
05
Prophecis和WeDataSphere
Linkis TFOS Engine: Prophecis 經過構建 Linkis TFOS Engine,支持從任務提交到 YARN,爲平臺提供了SparkML、TensorflowOnSpark、XGBoost On PySpark、LightGBM On PySpark等分佈式建模能力;
Machine Learning Flow Pipeline:Prophecis經過對接Linkis的Flow Engine、DataSphere Studio的Appjoint插件集成能力,實現了機器學習實驗工做流調度功能;
-
集成DSS工做流 :在複用DSS和Linkis能力的同時,Prophecis也構建了對應的DSS Prophecis AppJoint,爲DSS的工做流模塊提供了雲原生機器學習建模能力; -
LinkisMagic :Prophecis構建Linkis相應Magic函數,目前主要對接了Spark相關引擎類型,完善了Jupyter Notebook的大數據開發功能,爲用戶提供了一站式、交互式的AI開發環境。
06
Prophecis和KubeSphere
KubeSphere 是在 Kubernetes 之上構建的以應用爲中心的多租戶容器管理平臺,做爲面向雲原生應用的容器混合雲,其願景是打造一個以 Kubernetes 爲內核的雲原生分佈式操做系統,它的架構能夠很是方便地使第三方應用與雲原生生態組件進行即插即用(plug-and-play)的集成,支持雲原生應用在多雲與多集羣的統一分發和可視化運維管理。
更多關於KubeSphere的介紹,請訪問:
KubeSphere 官網中國站 (https://kubesphere.com.cn)
KubeSphere GitHub(https://github.com/kubesphere)
Prophecis在Application Factory的建設中引入了 KubeSphere,對其進行了定製開發,實現了機器學習容器應用從鏡像發佈、實例部署、多租戶資源隔離、服務監控到日誌收集的自動化管理,極大的下降了機器學習應用的運維成本。同時,WeDataSphere和KubeSphere 兩大社區也達成了開源合做的意向,朝着共建雲原生大數據生態前進,爲中國的新基建事業添磚加瓦。
07
Prophecis近期版本規劃
當前Webank的Prophecis已經完成與DataSphereStudio對接,打通了整個MLFlow的數據鏈路Pipeline,後續咱們會按照Roadmap逐步放出剩下功能,Prophecis RoadMap規劃:
Prophecis v0.1.x
服務部署腳本
用戶管理臺
Namespace、存儲、資源管理
多租戶隔離的我的開發環境(Jupyter Lab)
大數據開發方案(Livy&原生方案)
LinkisMagic
MLLabis
Control Center & UI
Prophecis v0.2.x
基礎平臺自動化部署腳本(Kubernetes/Docker/GPU)
分佈式建模
批量任務計算、告警
CLI
MLFlow
Base
Prophecis v0.3.x
資源管理、監控
模型部署
Model Factory(模型工廠)
Application Factory(應用工廠)
08
總結
WeDataSphere,BIG DATA MADE EASY.
用心作一個有溫度的開源社區
~歡迎關注~
掃碼關注咱們
微信號公衆號 : WeDataSphere
GitHub:WeDataSphere
若是喜歡咱們的產品或文章,請給咱們的GitHub點上你寶貴的star和fork哦~~
本文分享自微信公衆號 - WeDataSphere(gh_273e85fce73b)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。