在大數據分析和商業智能方面,Amazon QuickSight 是個很強大的服務。該服務能夠全面集成不一樣來源、不一樣格式的海量數據,進而經過基於機器學習的分析,並經過圖形化的報表向用戶揭示數據中蘊含的業務看法。該服務一經推出就得到了大量用戶的好評。html
一些童鞋可能還有印象,2018年的 re:Invent 大會上,AWS 發佈了預覽版 ML Insights,這是一組即開即用的機器學習和天然語言功能,可爲 Amazon QuickSight 用戶提供圖表之外的業務看法。藉助全新的 ML Insights 功能,Amazon QuickSight 能夠用言簡意賅的方式幫助用戶發現隱藏在數據中的趨勢,識別關鍵增加點,同時節省手動調查分析的時間。不只如此,QuickSight 即開即用的即席分析能力還能夠和多種分析功能相結合,構建全面的 BI 解決方案。算法
好消息來了:近日,適用於 Amazon QuickSight 的 ML Insights 功能已經正式發佈!數據庫
在該功能的幫助下,機器學習過程變得更簡單,不管用戶是否具有相關技能,任何人均可以在幾分鐘(而非幾周)內輕鬆地從數據中得到看法。目前 ML Insights 提供了以下功能:機器學習
下文將全面介紹這些由 ML 提供支持的新功能。工具
此前,ML Insights 曾在少許客戶中進行過預覽。在這期間,來自多個行業(包括電信、娛樂、市場營銷、零售、能源、金融服務和醫療保健)的客戶都已經過 ML Insights,利用其在 AWS 和本地不斷增長的數據量來得到業務看法,並得到了一些很是驚豔的成果:性能
Expedia Group,一家國際旅遊平臺,他們的目標是幫助客戶輕鬆前往世界各地。學習
「Expedia Group 兩項關鍵戰略要務就是以客戶爲中心和在全球範圍內創建與當地的關聯性。正因如此,Amazon QuickSight 這類工具對咱們很是有幫助,有助於咱們更輕鬆的衡量和報告業務指標並採起相應措施,從而幫助咱們的客戶找到最符合其旅遊搜索內容的匹配項。Amazon QuickSight 開箱即用的機器學習看法可幫助咱們持續監視咱們的業務是否存在異常、在出現異常值時向利益相關者發出警報,以及幫助咱們預測業務將來趨勢,這反過來也使團隊可以專一於其餘更加劇要的工做,而無需從頭構建這些功能。」
—— Amit Marwah,Expedia Group 航班數據與分析部門技術總監大數據
Ricoh Company, Ltd.是一家全球性公司,爲世界各地200多個國家和地區提供面向辦公室、生產印刷解決方案、文檔管理系統和 IT 服務等的圖像處理設備。優化
「機器學習在知足咱們不斷增加的數據量和 BI 要求方面發揮着愈來愈重要的做用。Amazon QuickSight 的 ML Insights 功能使強大的機器學習功能只需幾回點擊便可輕鬆使用。它使咱們能持續監控全球海量設備中的意外使用行爲、預測使用趨勢,以及交付內容全面的控制面板,控制面板中包含這些機器生成的看法並能以自動敘述性內容的形式將其呈獻給咱們的業務用戶。利用 ML Insights,咱們能夠快速找到出現異常的特定設備和功能並採起相應措施,從而改善體驗併爲客戶帶來價值。」
——Naoki Umehara,Ricoh Company, Ltd.組長ui
Tata Consultancy Services Limited 是一家印度跨國信息技術(IT)服務和諮詢公司,總部位於孟買馬哈拉施特拉邦,在全球46個國家/地區設有辦事處。
「Amazon QuickSight 使咱們可以輕鬆快速地將咱們的 Amazon Connect 聯繫中心指標與客戶端票證工具相集成,從而將客戶喜好的自動化交互式控制面板呈現給他們。咱們利用 Amazon QuickSight ML Insights 完全改變了咱們的人員配置、培訓和故障報告方式,同時還預測調用流程的移動方向並採起相應措施,從而預防調用激增併爲客戶提供更好的服務。」
—— Marco David Martinez,Tata Consultancy Services 雲經理
Siemens 是一家實力雄厚的跨國公司,主要業務爲電氣化、自動化和數字化。該公司仍是領先的發電和輸電系統供應商。
「利用 Amazon QuickSight 即開即用的 ML Insights 和按實際用量付費的訂價模式,咱們可以輕鬆地以節約成本的方式爲咱們的客戶提供基於機器學習的強大異常檢測功能,以分析其製造流程的性能、檢測生產線中的故障、監控數百臺機器的停機時長以及瞭解故障的根本緣由,而無需對機器學習和自定義開發進行大量投入。這使生產線主管和生產經理能在發生意外事件時收到警報並採起措施,以優化製造流程和提升績效。」
—— Massimilliano Ponticelli,Siemens 產品經理
Daiso Industries Co., Ltd 是一家創立於日本的全球性零售商和「百元店」的特許經銷商。
「利用 Amazon QuickSight,咱們可以構建本身的BI環境,可處理2個月內5000家商店 x 70000件產品的數據。精確的銷售預測和庫存優化是咱們面臨的最主要的業務挑戰。Amazon QuickSight 的 ML Insights 使咱們可以輕鬆快速地發現全部產品中的意外趨勢變化,並改善銷售預測和庫存優化狀況。」
—— Kenjiro Marumoto,Daiso Industries Co., Ltd.部門主管
接下來,就一塊兒看看這項功能的強大之處。
首先須要注意,ML Insights 僅支持企業版 Amazon QuickSight。若是您使用的是標準版,只需單擊「管理 QuickSight」頁面便可輕鬆升級。更多信息可參閱下列資料:
要開始使用 ML Insights,您須要將數據源鏈接到 Amazon QuickSight。可經過對 SQL 兼容的數據庫源的直接查詢或使用 SPICE 來訪問數據集。
下列演練中使用的數據必須具備如下屬性:
爲得到最佳結果,請確保您的數據集有足夠的歷史數據點。內置的 ML 算法須要至少40個歷史數據點才能學習和訓練模型,最多將使用最近的1000個數據點。例如,若是要按地理區域分析天天的銷售額,請確保至少有40天的數據。建議提供三個月到十二個月的數據,具體取決於您業務的季節性。
您可使用本身的數據集,或者下載示例數據集。下文將使用該數據集進行演練。
在 Amazon QuickSight 中建立數據集後,請從該數據集建立新的分析。有關在 Amazon QuickSight 中建立數據集和分析的詳細信息,請參閱 Amazon QuickSight 用戶指南。
ML Insights 會自動解讀您的數據並提供情景式看法,這稱爲建議性看法。不一樣圖表可產生不一樣類型的看法。例如,若是採用時間序列圖表,則可能得到從時段到時段的變化、異常和預測等看法。
來看一個示例:
您應在左側窗格中看到建議性看法的列表。建議性看法將以普通的語言簡要爲您總結數據。當您將圖表添加到分析中時,您將在左側窗格中看到額外的建議性看法,按圖表名稱分組。
您能夠選擇一項建議性看法(如日期到日期的變化)以突出顯示該圖表中的數據點或細分市場。再次選擇此看法可將其取消選中。
利用 ML Insights,您能夠對多達一百萬個指標同步運行由ML提供支持的異常檢測,以發現每每在聚合數據中被掩蓋的隱藏趨勢和異常值。要詳細瞭解異常檢測的訂價,請轉到 Amazon QuickSight 訂價並選擇 ML Insights。
接下來開始使用異常檢測:
1.在應用程序欄上選擇添加,而後選擇向表格添加異常。此操做可爲異常檢測建立看法圖表。
2.展開頁面頂部的字段區域,並至少添加一個類別字段。
類別表示 Amazon QuickSight 拆分指標所依據的維度值。例如您要對全部產品類別和產品 SKU 分析收入中的異常。假設有10個產品類別,每一個類別有10個產品 SKU,Amazon QuickSight 將按100個惟一組合拆分指標,並對拆分所得的每一個指標運行異常檢測。
3.在看法圖表中選擇開始使用,以配置異常檢測做業。
4.在異常檢測配置窗格中,配置如下選項:
5.選擇肯定。在您將分析發佈爲控制面板後,Amazon QuickSight 纔會實施計劃。在分析中,您能夠選擇手動運行異常檢測,而無需設置計劃。
6.設置配置後,請選擇當即運行來手動運行檢測。您將看到消息「正在分析以查找異常… 這可能須要一段時間…」。分析可能須要幾分鐘到幾小時,具體取決於數據集的大小。
異常檢測完成後,您將看到看法圖表中列出的數據中在最近一段時間內的主要異常。Amazon QuickSight 還將計算和顯示預期值,以便您能更好地瞭解該異常的重要性。
7.要查看此數據的全部異常,請選擇圖表右上方的選擇器,而後選擇瀏覽異常。
在詳細異常頁面,您能夠看到針對最近一段時間檢測出的全部異常。圖表的標題表示應用於類別字段的惟一組合的指標。圖表上突出顯示的數據點(在圖表的最右側)表示針對該時間序列檢測出的最新異常。
在左側窗格中,您將看到該異常的主要原由(基於您預約義的維度)。將光標懸停在主要原由上時,Amazon QuickSight 會顯示對該原由的重要性的說明。
8.若要按日期查看異常,請選擇圖表頂部的按日期顯示異常以顯示日期選擇器。圖表將顯示針對您的異常檢測配置的每一個時間單位所檢測到的異常數。您能夠選擇特定日期以查看該日期的異常。例如,若是您從圖中選擇2018年11月1日,則條形圖將突出顯示該日期的異常數。
重要信息:Amazon QuickSight 使用數據集中的前40個數據點進行訓練;這些數據點將不會計入異常檢測算法中。您可能不會看到前40個數據點中的任何異常。
9.使用窗格頂部的篩選控件更改異常閾值,以顯示具備高、中、低重要性的異常,或僅顯示高於預期或低於預期的異常。您還能夠按數據集中的類別值進行篩選,以查看僅針對這些類別的異常。
10.若要返回分析,請選擇窗格頂部的返回分析。
利用內置的 ML 算法,您如今能夠經過簡單的點擊操做預測業務指標,而無需編寫代碼或生成複雜的電子表格。
1.在您的時間序列圖表中,選擇圖表右上角的選擇器,而後選擇添加預測。Amazon QuickSight 將使用 ML 分析歷史數據,並呈現對接下來14個時段的預測。
2.在左側的「預測」屬性窗格中,您能夠自定義預測設置。例如,您能夠更改要預測的將來時段的數量,還能夠向過去的時間內添加「預測」時段以便將歷史實際值與基於 ML 的預測值進行對比。
您能夠經過更改預測間隔和手動設置季節性(時段數)來調整預測條帶的寬度。選擇應用便可保存您的更改。
3.從圖表中選擇已預測的數據點,而後選擇假設分析。利用假設分析,您能夠設置特定日期或日期範圍的目標值,Amazon QuickSight
將合理調整預測以達到此目標。
4.選擇應用可查看針對目標調整的新預測和原始預測。您能夠將光標懸停在數據點上以查看詳細信息。
利用由 ML 提供支持的預測功能,Amazon QuickSight 可幫助您預測複雜的真實場景,例如具備多個季節性的數據。它將排除異常值並估算缺失的值。
若要以 CSV 格式導出預測數據,請選擇圖表右上角的選擇器,而後選擇導出爲CSV。
自動敘述性內容使您能夠建立圖表的天然語言總結。您能夠將這些總結嵌入控制面板中以突出顯示對您的讀者有重要意義的重要看法,從而使他們可以訪問數據,而沒必要仔細查看整個控制面板。當您定義模板時,敘述性內容將隨數據集中的數據刷新而自動更新,與圖表同樣。
如下步驟展現瞭如何開始使用自動敘述性內容:
您將在分析中看到帶有預約義模板的看法圖表。請注意,字段區域已填充了日期、指標和類別。這些設置經過您用於建立看法圖表的圖表進行填充。您能夠根據須要自定義這些字段。
3.要編輯敘述性內容,請選擇看法圖表菜單,而後選擇自定義敘述性內容。您將看到「配置敘述性內容」窗格,您可在其中編輯看法模板。您可使用格式工具欄經過更改大小和顏色來設置內容的格式。您還能夠插入表達式和條件語句,如 IF 和 FOR 語句。
在左側窗格中,您能夠在敘述性內容中添加運算。運算是預約義的,例如時段到時段、時段到日期、增加率、最大值、最小值和主要推進因素,您能夠在模板中引用這些運算來描述您的數據。目前,Amazon QuickSight 支持13種不一樣運算。此示例中默認添加 PeriodOverPeriod,由於咱們從建議性看法窗格中選擇了「日期到日期的變化」看法。
4.要添加新運算,請選擇窗格左下角的「添加運算」。系統將提示您從運算列表中進行選擇。出於本演練的目的,請選擇增加率運算類型,而後選擇下一步。
5.您能夠配置運算的某些方面。對於增加率,您能夠更改要計算其增加率的時段數。作出選擇後,請選擇肯定。
6.如今展開左窗格中的「運算」。您應看到 PeriodOverPeriod 和 GrowthRate 選項。
請注意:運算名稱必須惟一。建立運算時,請提供惟一的名稱。您能夠在模板中引用同一類型的多個運算。例如,您有兩個指標,如銷售額和已售單位數,您能夠爲每一個指標建立 GrowthRate 運算,併爲每一個運算提供不一樣的名稱。而後便可在模板中按名稱引用特定運算。
另請注意:異常運算與全部其餘運算類型均不兼容。例如,您有 PeriodOverPeriod 或 GrowthRate 運算,則您將沒法向同一個看法圖表中添加異常運算。
7.要向敘述性內容中添加增加率,請在敘述性內容模板中添加短語如下時間段內的複合增加率。從「運算」窗格中,選擇 GrowthRate,而後選擇 timePeriods 以在敘述性內容中插入 GrowthRate.timePeriods 表達式。此表達式引用在配置中設置的時段數。
8.經過輸入日期爲完成句子。而後經過依次選擇 GrowthRate、compounded GrowthRate 和 formattedValue 來從「運算」窗格添加另外一個表達式。選擇 formattedValue 將返回根據應用於字段中指標的格式進行格式化的短語。要以整數或小數格式查看原始值,請選擇值而不是 formattedValue。
1.接下來,咱們來試試條件語句:
要插入 IF 語句,請將光標放在敘述性內容模板的末尾。在插入代碼菜單中,選擇內聯 IF。
2.系統將提示您輸入代碼。在左窗格中,依次選擇 GrowthRate、compoundedGrowthRate 和值。要插入值,請輸入> 3,而後選擇保存。
3.對於條件內容,請輸入 Great!。選擇文本並使用格式菜單將顏色更改成綠色。
4.重複前面的步驟,對增加率值輸入<3。對於條件內容,請輸入 Bad!。而後將文本格式設置爲紅色。
5.選擇應用。您應看到以下所示的結果。
模板可爲您提供用於自定義敘述性內容的高級工具。在此模板中,您還能夠引用分析或控制面板中的參數,以及利用一系列內置功能執行更多計算。
開始使用自動敘述性內容和了解語法的最好方法就是使用經過建議性看法生成的現有模板。可是您還能夠經過依次選擇添加和添加看法來從頭開始建立看法圖表。
動手試試吧!嘗試建立枚舉最近三個月的最暢銷產品的敘述性內容。
從本演練中您能夠了解到,ML Insights 可幫助您執行大規模異常檢測,而且只需單擊幾回便可建立業務預測。您能夠在幾分鐘內在控制面板中生成豐富且用戶友好型自動敘述性內容,而且無需任何自定義開發或 ML 技能。