概述
在人工智能領域存在這樣的現象,不少用戶有人工智能的需求,可是沒有相關的技術能力。另外有一些人工智能專家空有一身武藝,可是找不到需求方。這意味着在需求和技術之間須要一種鏈接做爲紐帶。html
今天PAI正式對外發布了「AI市場」以及「PAI自定義算法」兩大功能,能夠幫助用戶5分鐘將線下的spark算法或是pyspark算法發佈成算法組件,而且支持組件發佈到AI市場供更多用戶使用。有了以上功能,算法開發者和算法需求雙方能夠基於PAI的開放框架和平臺實現算法交易,實現生態和PAI的共融。算法
詳細使用說明
價格說明
使用SQL、SPARK2.0、PYSPARK2.0 3種算法框架自行開發出的算法上傳到PAI-STUDIO中,運行產生的費用按照PAI資源成本價收取,費用爲1元/計算時。sql
功能詳解
1.控制檯說明
首先進入PAI控制檯,找到Studio-可視化建模下的「算法發佈」功能。框架
2.開發算法代碼
基於本地調試文檔https://help.aliyun.com/docum...,開發算法包。本文使用官方提供的pyspark案例介紹,請前往https://help.aliyun.com/docum...。函數
3.點擊「建立自定義算法」人工智能
算法名稱:算法組件的名字spa
算法惟一標示:算法的後臺惟一標識,能夠用來查詢日誌等信息調試
算法框架:sql、spark、pyspark日誌
算法包:若是是sql算法,須要上傳sql腳本。spark算法提交的是打包好的jar包。pyspark提交的是工程打包好的zip文件code
算法種類:算法包發佈到PAI-STUDIO後所在的文件夾
入口參數:sql組件不須要、spark須要寫jar包的入口類(例:com.aliyun.odps.spark.examples.simhash.SimHashSpark)、pyspark須要寫入口的py文件和入口函數(中間用.分隔)
本文使用官方提供的pyspark算法包,上傳pyspark.zip文件,輸入入口文件和入口函數
read_example.mainFunc
如圖:
4.編輯版本
提交算法包後,在控制檯能夠看到算法包實例,這時候須要爲算法包配置UI展現相關內容。
這裏的版本指的是組件的UI展現形式,只有配置了版本的才能夠發佈。
點擊添加版本:
點擊前往配置進入組件配置界面,全部算法組件的配置能夠經過拖拽的形式可視化操做。
5.組件UI編輯
組件的輸入和輸出樁能夠在下圖部分自由控制,本案例實現的是讀一個表而後把其中兩個字段寫到另外一個表裏,對應代碼中的inputTable1和outputTable1,若是多個輸入輸出樁能夠在代碼中定義inputTable二、inputTable3等,組件樁會自動映射。
#定義輸入節點 INPUT_TABLE = arg_dict["inputTable1"] OUTPUT_TABLE = arg_dict["outputTable1"] ID_COL = arg_dict["idCol"] CONTENT_COL = arg_dict["contentCol"]
本案例只使用了一個輸入和一個輸出,這部分不須要修改。
接下來編輯配置信息,在上述代碼中除了inputTable和outputTable這兩個參數,剩下的全部參數都要對應到組件的基礎控件。本案例中idCol和contentCol兩個參數對應的是輸入表中選擇的兩個字段,都是單選。在左側基礎控件中找到「單字段填寫控件」,由於是兩個參數,因此拖兩個出來。
單擊第一個控件,在右側基礎信息中進行配置。
Name(必選項):算法代碼中參數的映射項,本案例應該寫idCol。設置好後,說明算法代碼中拿到的idCol信息就是該組件的輸入
標籤:該控件的展現名
converter:通常不用填寫
綁定輸入/輸出:組件輸入輸出樁的綁定,本案例選擇輸入#1
支持的數據類型:默認所有支持
分別配置兩個控件的信息對應到idCol和contentCol。
6.發佈組件
編輯好UI版本,記得點擊下方的保存按鈕。
回到控制檯,刷新頁面,點擊「使用此版本」
這時候組件就能夠發佈了,
發佈分兩種:
發佈到PAI-STUDIO:發佈到PAI-STUDIO須要選擇區域和項目,發佈過去的組件只能在當前項目下使用,而且主子帳號共享
發佈到數加智能市場:生成的組件會發布到AI市場,供全部PAI用戶下載使用
7.組件調用
進入組件發佈的PAI-STUDIO項目,在左側「組件」tab下找到「自定義算法」文件夾,能夠找到發佈的算法並使用