Azure機器學習入門(二)建立Azure機器學習工做區

咱們將開始深刻了解如何使用Azure機器學習的基本功能,幫助您開始邁向Azure機器學習的數據科學家之路。web

Azure ML Studio (Azure Machine Learning Studio / Azure ML Studio)是使用Azure機器學習雲實現預測分析解決方案的主要工具。Azure機器學習是基於雲計算和自容式的強大預測分析解決方案,具備完整的開發、測試和生產環節快速建立的獨立閉環。算法

Azure ML Studio提供交互式和可視化的工具輕鬆構建、測試和迭代預測分析模型。您可在Azure ML Studio中以拖拽的方式將數據集和分析模型在交互式畫布相鏈接建立實驗,而後編輯實驗並迭代計算預測分析模型,若是須要還可保存計算的副本並重復迭代計算。最終您可將實驗做爲web服務發佈於Azure,因而您的預測分析模型就可在web被訪問。編程

基於雲計算的Azure機器學習的另外一個核心優勢就是幾乎沒有任何的時間和基礎設施的啓動成本。尤爲是Azure機器學習相關的任務均可在現代web瀏覽器中完成。canvas

Azure機器學習基本術語

爲了幫助您快速開始,讓咱們定義描述各類功能、組件和工具的常見術語。windows

  • Azure機器學習(Azure Machine Learning)包含全部必要的工具,可用來在微軟Azure雲平臺設計、開發、分享、測試和部署預測分析模型解決方案。
  • Azure機器學習工做區(Azure Machine Learning workspaces)表示離散的"切片"式的 Azure機器學習工具集,它能夠按照如下的標準進行分區:
    • 工做區名稱(Workspace name)必須是惟一的,而且是肯定機器學習工做區的主要方法。
    • 工做區全部者(Workspace owner)是有效的微軟帳戶,用於管理對此Azure機器學習工做的訪問。
    • 數據中心地理位置(Data center location)定義Azure機器學習工做區所在的Azure數據中心物理位置。
    • 存儲帳戶(storage account)定義惟一的Azure存儲帳戶,用於存儲全部與此Azure機器學習工做區的相關的數據和工件。
  • Azure機器學習實驗(Azure Machine Learning experiments),實驗是在Azure機器學習工做區中建立,可經過迭代計算實現快速開發機器學習解決方案的主要方法。在每個Azure機器學習實驗中,Azure ML Studio提供交互式、可視化的工做區,可輕鬆建立、測試和迭代計算預測分析實驗。這些實驗可在Azure ML Studio中提交執行。Azure ML Studio實驗是高度重複的,很容易建立、編輯、測試、保存和從新運行試驗。Azure機器學習實驗實驗是爲現代數據科學家專門設計,使其可以在評估新的預測模型時以"快速失敗"的方式不斷改進細化模型。簡單來講,Azure機器學習提供迭代的方式快速失敗或者最終取得成功。
  • Azure ML Studio是主要的交互式預測分析工做臺,在Azure機器學習工做區爲數據科學家提供可視化的設計工具以拖放的方式建立Azure機器學習實驗,在Azure機器學習工做區提供訪問Azure ML Studio惟一的運行環境。除了能夠建立新的實驗,Azure ML Studio還包括Azure機器學習實驗的示例連接。這些功能能使您很容易的與更有經驗的人學習,在數據科學的旅程中利用最好的技術和工具幫助您完成基於領域的預測分析的目標。
  • Azure機器學習web服務(Azure Machine Learning web servicesA zure機器學習實驗以REST API的方式在網絡中提供API訪問服務,這些服務 能夠是 簡單的web服務或者OData端點。API以兩種類型的rest風格的web接口:
    • 請求響應服務(Request Response Service - RRS) 適用於獨立的、低延遲,須要同步使用的預測模型。
    • 批處理執行服務(Batch Execution Service - BES)適用於異步處理的批量數據記錄。BES支持多種格式的數據源,好比blob、表、SQL Azure,以及HDInsight(做爲Hive查詢的結果)和HTTP源。
  • 數據集(Datasets)是指上載至Azure ML Studio被用於預測模型的數據。Azure ML Studio提供大量的示例數據集可進行實驗,您也可上傳更多的數據集知足您的計算需求。
  • 模型(Modules)是應用於數據計算的算法。Azure ML Studio包含大量的模型,即從數據訓練、評價到驗證過程的函數。下面是包含的模型示例:
    • 轉換爲ARFF(Convert to ARFF)將.NET序列化數據集轉換爲ARFF格式。在機器學習領域,ARFF是常見的表示屬性-關係的文件結構。它一般被定義爲ASCII文本文件,描述實例列表共享的一系列屬性。
    • 基本統計(Elementary Statistics)是計算基本的統計數據,如均值、標準差等。
    • 線性迴歸(Linear Regression)建立在線梯度降低的線性迴歸模型。
    • 評估模型(Score Model)評價訓練的分類或者回歸模型。

模型可能包含一組參數用於配置模型的內部算法。當您在畫布(canvas)上選擇一個模型,畫布右側的窗格中顯示模型的參數。您能夠在該窗格中修改參數優化模型。瀏覽器

快速開始

Azure機器學習之旅的第一步是得到微軟Azure環境,這裏有幾種方法您能夠選擇:網絡

  • 選擇1,使用在 http://azure.microsoft.com/en-us/pricing/free-trial 提供的免費Azure試用帳號。
  • 選擇2,在 https://studio.azureml.net/Home 使用Azure機器學習的試用
    • 這是Azure提供的免費特別功能,所以只容許您訪問Azure機器學習環境。
    • 這對於新的採納者而言是一個極其低摩擦的選擇:開始的惟一必須條件就是有效的微軟帳號。
    • 若是您須要註冊微軟帳號,請訪問 http://windows.microsoft.com/en-US/windows-live/sign-up-create-account-how
    • 您使用有效的微軟帳號登錄後,躍入眼簾的是如圖3-1所示的幫助您入門的介紹視頻。您也可在此連接 https://go.microsoft.com/fwlink/?LinkID=518038 回顧介紹視頻。

圖Azure機器學習介紹視頻機器學習

請注意若是您選擇的是使用免費的Azure機器學習試用,那麼您將只有Azure機器學習功能的訪問權限,沒有權限使用所有的Azure環境。爲真正最大化您的體驗,強烈建議您獲取所有微軟Azure環境。 異步

 

建立第一個Azure機器學習工做區

讓咱們建立第一個Azure機器學習工做區,在這一點上Azure免費帳戶與付費的Azure訂閱是相同的。讓咱們從 https://manage.windowsazure.com 導航至Azure管理門戶。在那裏,在左側的導航欄點擊機器學習,以下圖所示。 編程語言

 

Azure機器學習工做區包含所有您須要在雲端建立、管理和發佈機器學習實驗的工具。若要建立一個新的Azure機器學習工做區,請單擊頁面左下角的新建圖標,在以下圖的頁面中補充必填項。

 

建立一個新的Azure機器學習工做區:

  • 工做區的名稱(WORKSPACE NAME)在您的Azure機器學習工做區中是惟一的。請您知悉若是您將光標從工做區名稱區域移開時,會檢查您提供的工做區名稱是否惟一,若是惟一的話會在文本框的右側顯示綠的複選標記。
  • 工做區全部者(WORSPACE OWNER)提供有效的微軟帳號(之前的Windows Live ID)。注意,它不能是非微軟帳戶,好比您的公司電子郵件。建立免費微軟帳戶請登陸 www.live.com
  • Azure Machine Learning的位置(LOCATION)僅在美國南中部地區可用。
  • 存儲帳戶(STORAGE ACCOUNT)選項能夠選擇建立一個新的存儲帳戶或者使用現有的存儲帳戶。
  • 新的存儲帳戶名稱(NEW STORAGE ACCOUNT NAME):若是您選擇爲您的Azure機器學習的工做區建立新的存儲帳戶,請確認存儲帳戶的名稱只能是小寫字母數據字符。若是名稱是惟一的,您會在文本框的右側看到綠色的複選標記。

一旦您建立機器學習工做區,Azure將提供全新的Azure機器學習工做區供您建立和承載您的額Azure機器學習實踐。

在建立您的Azure機器學習以後,單擊您的新的Azure機器學習工做區的圖標您將看到以下圖所示的界面。

 

請注意,這是由Azure管理門戶的登錄Azure機器學習工做區。在此,您能夠直接訪問Azure機器學習Studio的工具管理用戶訪問工做區的權限,管理在此工做區中承載機器學習實驗的Web服務。在頂部的導航菜單提供了Azure機器學習工做區功能的導航。

  • 儀表板(DASHBOARD)能夠監控您的工做區的在一段時間內的相對和絕對計算的使用量。
  • 配置(CONFIGURE)功能用來容許或者拒絕用戶對於您的工做的訪問。
  • Web服務(WEB SERVICES)選項容許您管理web服務和配置端口,且包含爲數據科學家和分析師經過請求/響應的API訪問或者批處理的代碼示例,代碼示例由流行的編程語言C#、Python和R語言組成。

在咱們重溫這些特性的細節以後將開始探索Azure 機器學習的環境。

若要訪問您的工做區,點擊ML Studio的登錄連接進入您的新的 Azure 機器學習工做區。下圖就是Azure ML Studio工做區的截圖。

 

 

當您首次進入Azure ML Studio的工做區,您會看到以下的導航選項在頂部和左側的導航欄上:

頂部導航欄:

  • Home 文檔和其餘資源的連接;
  • Studio Azure ML Studio實驗的登陸頁;
  • Gallery (Preview) 是趨勢實驗和樣本的集合。

左側導航欄:

  • EXPERIMENTS 實驗的建立、運行和保存草稿;
  • WEB SERVICES已發佈的實驗列表;
  • DATASETS上載的數據集,可用於實驗的計算;
  • TRAINED MODELS 使用Azure ML Studio內置的機器學習算法"訓練"的新預測模型;
  • SETTINGS 設置的帳戶和資源的設置集合。
相關文章
相關標籤/搜索