阿里雲機器學習PAI DSW 2.0 & Alink商業版重磅發佈

DSW 2.0:面向AI研發的集成開發平臺python


DSW(Data Science Workshop)是阿里巴巴PAI團隊根據多年的AI算法和產品研發經驗積累,圍繞提升AI算法研發效率,下降研發成本而推出的一款適用於各種AI開發者的雲端機器學習集成開發環境。DSW2.0是藉助阿里雲ECS,Docker和Kubernetes等雲原生技術,可以在幾分鐘內幫用戶完成環境搭建,相對DSW1.0開放更高的開發權限,知足各個層面客戶的使用需求。web

  • 雲原生架構

DSW藉助阿里雲ECS,Docker和Kubernetes等雲原生技術,可以在幾分鐘內幫用戶完成環境搭建。用戶能夠根據算法須要和成本考慮,選擇阿里雲ECS提供的包括CPU和異構計算GPU在內的全部資源規格。算法

  • 知足不一樣層次開發習慣

結合交互式編程和命令行輸入,DSW提供了三種編程入口: WebIde適用於工程化要求比較高的項目;JupyterLab適用於快速POC試驗;Terminal入口可用於快速執行Shell命令,運行程序和簡單的編輯等。編程

  • 預裝豐富插件

DSW還開發和預裝了各類JupyterLab和WebIDE插件,好比廣受深度學習開發者喜好的可視化工具Tensorboard,用戶在DSW內經過Launcher,Commands打開,甚至還可使用%tensorboard魔法命令直接在Notebook中開啓等多種方式使用Tensorboard。不只支持本地文件,還能夠打開存放在OSS,ODPS裏的訓練日誌。針對算法同窗使用Python比較多的特色, DSW的WebIDE內安裝了Python插件,能夠直接在瀏覽器內在線調試,單步跟蹤程序運行。用戶還能夠根據須要,自主安裝須要的任意插件。瀏覽器

  • 支持多種數據源讀寫

NAS, OSS,雲盤和MaxCompute,尤爲是內置了dswmagic魔法命令可讓用戶在ipynb文件中使用SQL語句讀寫MaxCompute表中數據,預置的SQL編輯器支持語法高亮、智能提示、自動補全等功能,還支持運行帶變量替換功能的Sql腳本。查詢結果自動以最友好的圖形化展現。架構

Alink:流批一體機器學習算法平臺機器學習


Alink擁有豐富的批式算法和流式算法,可以幫助數據分析和應用開發人員可以從數據處理、特徵工程、模型訓練、預測,端到端地完成整個流程。Alink提供的功能算法模塊中,每個模塊都包含流式和批式算法。好比線性迴歸,包含批式線性迴歸訓練,流式線性迴歸預測和批式線性迴歸預測。另外,Alink算法覆蓋分類、迴歸、聚類、評估、統計分析、特徵工程、異常檢測、文本、在線學習、關聯分析等經典領域,是一個通用的機器學習算法平臺。編輯器

  • 算法性能

咱們從下圖中能夠看出在迴歸算法中,Alink算法性能最高優於Spark 1.38倍;分類算法中Alink大多數算法性能優於Spark,最高優於2.52倍;聚類算法Alink算法性能最高優於Spark 1.85倍;協同過濾Alink算法性能最高優於Spark 2.26倍。函數

Flink VS Spark算法性能工具

  • 更友好的交互式體驗

咱們提供兩種用戶使用界面:web和PyAlink。Web界面提供拖拽的方式建立試驗,經過對每個組件進行配置完成整個試驗的參數配置。在各個算法節點旁,咱們用閃爍的小燈泡💡表示「運行中」的狀態,用對勾✅表示「運行完成」的狀態。通常狀況下,只有批式(batch)組件纔有可能運行結束。基於各個組件的運行狀態,能夠十分方便地判斷當前實驗運行到了什麼程度。

同時爲了知足腳本用戶的需求,咱們提供了PyAlink on notebook,用戶能夠經過PyAlink的python包使用Alink。PyAlink支持單機運行,也支持集羣提交。而且打通Operator(Alink算子)和DataFrame的接口,從而使得Alink整個算法流程無縫融入python。PyAlink也提供使用Python函數來調用UDF或者UDTF。

阿里雲機器學習PAI是覆蓋人工智能全鏈路的產品家族,自上線以來,受到廣大AI開發者的喜好,通過千錘百煉,證實不只適合我的和團隊研發,也支持大規模算法競賽和教育培訓。本次重磅發佈的PAIDSW2.0和商業版Alink致力成爲最懂用戶的輕量化AI服務,包含數據處理、建模、訓練、模型優化、在線預測等多種產品版塊,爲用戶提供一站式體驗服務。

發佈會傳送門

產品詳情​www.aliyun.com圖標

相關文章
相關標籤/搜索