英特爾發佈"概念驗證"白皮書:AI人工智能落地,如何輔助決策者將價值最大化

人工智能算法已經出現多年,可是直到最近,人工智能的價值纔開始在企業中獲得快速擴展。前端

快速擴展的緣由基於兩方面:一方面處理和存儲數據的成本都已大幅降低。另外一方面,計算科學家已經改進了人工智能算法設計,包括神經網絡在內,使得訓練模型得到了更高的準確度。算法

人工智能系統首先學習數據,而後從中推理出結果安全

爲了進一步加快人工智能普及速度,推進了基礎設施創新,業界和學術界紛紛將與人工智能有關的功能直接嵌入到硬件之中,例如:最新的英特爾®至強®可擴展處理器爲普遍的人工智能工做負載提供可擴展的性能,在深度學習模型訓練和推理中提供突破性的性能,英特爾®Nervana™ 神經網絡處理器則採用專爲神經網絡構建的新型架構。性能優化

專業硬件的加持,使得人工智能潛力明顯,可是許多企業尚未開始採用人工智能,其採用速度也比不上媒體和學術機構在報告中推測的速度。網絡

通過媒體調查,這些企業擔憂普遍的潛在機遇帶來的挑戰。架構

那麼,什麼樣的機遇可以帶來最好的結果?如何確保能取得成功的結果呢?框架

英特爾爲此提出了一套「概念驗證(PoC)」的解決方案,而且詳細撰寫了一套「白皮書」,可以幫助決策者回答這些問題,同時最大化價值,最小化風險。函數

注:概念驗證(POC)是一種「封閉」而有效的解決方案,從瞭解要求一直到實現成功,可根據明確的標準對該解決方案進行評估和測量。對於任何人工智能項目或程序,概念驗證讓決策者可以:更快收穫價值、獲取技能和經驗、測試硬件、軟件和服務選項、確認和解決潛在的數據瓶頸、突出人工智能對 IT 基礎設施和普遍業務的影響、提高人工智能的積極印象,提升用戶的信任度。性能

概念驗證具體來講分爲五個步驟。第一步確認機遇、第二步肯定問題的特徵並分析數據、第三步架構和部署解決方案、第四步評估商業價值、第五步縱向擴展概念驗證。大數據文摘也將白皮書簡要介紹以下。學習

第 1 步 確認機遇

請你務必從一開始就明確瞭解你但願利用人工智能達到哪些效果,爲什麼它對你的企業相當重要,以及你如何確保它可以提供所需的功能,這些很是重要。若是你還沒有明確能從人工智能中得到哪些益處,你應該實施評估,看看人工智能可在哪些地方產生立竿見影的效果:

  • 思考行業中的其餘企業都在使用人工智能作些什麼。
  • 在你的企業中,看看哪些方面存在明確須要解決的問題,或哪些方面能從人工智能中獲益。
  • 在工做中利用現有的專業知識庫,使用內部已有的技能和經驗。

在肯定了哪些方面能從人工智能獲益後,能夠根據幾項標準來測試各個機遇。這項工做無需花費很長時間,而如下問題能夠幫助你確認你的組織在規劃方面的不足,以避免倉促啓動人工智能項目:

  • 你是否明確知道本身想要解決的問題、其對應的具體要求,以及你將如何衡量成功?你是否考慮過或曾部署其餘解決方案來解決此問題,後來由於傾向於人工智能而放棄這些解決方案?
  • 是否明確限定了機遇的範圍?例如,你是否能簡要說明這個機遇會使用到的數據集、關鍵組件、將會受到影響的人員,以及其餘依賴項?它是某個更大解決方案的一部分嗎?
  • 你是否具有讓它成爲現實所需的技術資源和資金?你是否可以不受技術、合同或其餘因素的阻礙,直接使用你所需的數據源?
  • 對業務的有利影響是否足以抵消所付出的努力?那些容易看到的成果很是重要,有利於提升用戶對人工智能的信任度,讓更多的利益相關者參與進來。
  • 推進力和得到的支持是否足夠(例如高層的支持)?受到影響的業務部門是否全力參與來解決這個問題?
  • 時間安排上是否合適?是否明確指定了交付團隊?這個團隊是否具備足夠的時間、技能和動力來完成這項工做?
  • 組織是否具有更普遍的數據科學和 / 或人工智能戰略?此戰略是否與其目標一致?組織目前已具有哪些數據科學基礎設施和專業知識?
  • 概念驗證成功完成以後,後續準備怎麼作?是否有資金用於維護或擴展該解決方案?負責運營的 IT 部門是否獲知了基本狀況並準備好參與其中?

第 2 步 肯定問題的特徵並分析數據

在你確認和測試過機遇以後,接下來可將注意力轉向瞭解和詳細闡述待解決的問題,將其映射至更普遍的類別,例如推理、感知或計算機視覺。

組織遭遇的部分挑戰,尤爲對於尚處於人工智能早期階段的組織而言,就是內部沒有足夠的技能。

在你的人工智能工做流程中,這也是思考更多可能會給解決方案帶來影響的技術問題的絕佳時機。例如:

  • 你是否傾向使用某些硬件或軟件?爲何(基準測試數據、TCO、首選供應商)?
  • 安全 / 監管 / 數據 / 其餘方面的需求是否更傾向於選擇本地系統而不是雲?
  • 你的解決方案是在本地本身維護,仍是部署到數據中心中?
  • 當前數據中心的利用率是多少?性能 - 功耗比有多重要?
  • 你會按照什麼頻率和數量爲訓練 / 推理提供新數據?
  • 在靜態和動態情形下,如何保持原始數據和生成的洞察始終安全?

第 3 步 架構和部署解決方案

下一個問題是,如何設計和部署已經過概念驗證測試的解決方案。如圖 3 所示,這由一個技術棧組成,包括:

  • 基礎產品和系統基礎設施
  • 人工智能特定的軟件,用於推進基礎設施建設
  • 起支撐做用的人工智能框架,用於爲計劃的解決方案提供支持
  • 虛擬化技術、前端軟件和 / 或硬件

在這個階段,你能夠考慮究竟是構建、購買或再利用硬件和軟件,仍是利用雲服務。

即使是按照最佳實踐構建和測試的基礎設施和軟件,仍然須要考慮人工智能的各類要求。尤爲是持續提供高質量數據這一要求。數據科學家可以與 IT 系統架構師合做設計從數據中心到邊緣的部署架構,而且考慮軟件集成、網絡鏈接、硬件問題和其餘各方面。可能須要測試多個選項:應該採用測試加學習的方法,以便能獲取更多的經驗。

完成以後,你能夠處理解決方案的其餘人工智能相關元素——構建模型、訓練和調優。

構建模型

模型構建屬於人工智能的核心任務。數據科學家參與其中,使用訓練數據和管理參數來實施迭代測試。這樣,在他們發送模型用於更普遍的訓練和調優以前,能夠檢查模型的初始融合準確性。

訓練和調優

訓練和調優是人工智能工做流程中計算密度最高的部分。在這一階段,數據科學家須要肯定在哪些參數下,模型可以基於所提供的訓練數據實現最有效的融合,同時解決做業調度和基礎設施管理等常見的傳統 IT 問題。

這個過程很是耗費人力,數據科學家須要花費大量時間來手動整理數據並執行數百次試驗。

第 4 步 評估商業價值

做爲解決方案設計的一部分,你須要定義概念驗證的評估標準:對於工程師,這些標準能夠轉化成可以設計、衡量、持續自動測試的評估標準。

現人工智能解決方案架構能夠表示爲堆棧

如下這些評估標準可用於評估商業價值:

  • 準確度:解決方案提供的結果和洞察是否正確?是否能夠重複?
  • 完備性:這種解決方案是否正確使用全部數據源?
  • 時效性:是否在須要時,按照須要提供洞察?
  • 除此之外,不管其運行情況是否符合預期,此解決方案還需遵循其餘標準:
  • 擴展性:若是數據量或用戶數量隨時間不斷增長,或者急劇增長,該解決方案是否能繼續發揮做用?
  • 兼容性:解決方案是否爲開放的,而且能使用標準協議與第三方數據源和服務集成?
  • 靈活性:若是數據需求或模型發生變化,解決方案可否適應不斷變化的環境?
  • 工程性:可否簡單快捷地調試訓練模型中的錯誤輸出?

最後,須要根據人工智能領域廣爲人知的「可解釋性」(即決策質量)來評估解決方案的需求。與可解釋性有關的標準包括:

  • 偏見:如何確保人工智能系統不會基於訓練數據、模型或目標函數的缺點對世界存在偏見(或者對存有偏見的世界保持公正的態度)?若是其人類創造者下意識或潛意識地存有偏見呢?
  • 公平公正:若是決策是基於人工智能系統制定的,如何確認這些決策是否公平公正?在這種環境中,公平公正意味着什麼——對誰公平?
  • 因果聯繫:該模型除了提供正確的推理以外,是否還能解釋一些基礎現象?
  • 透明性:針對基於人工智能的洞察給出的解釋,用戶可否理解?在什麼樣的狀況下,所發現的結果能夠被質疑?
  • 安全性:不管用戶對得出結論的過程瞭解與否,如何增長用戶對人工智能系統可靠性的信心?

第 5 步 縱向擴展概念驗證

現代平臺的性能優化

截至目前,你已經定義了問題,設計瞭解決方案,分析了數據且創建了模型。概念驗證已成功構建、測試和部署。那接下來應該作什麼呢?

積極的用戶體驗有利於提高用戶需求,以得到更大的成功。可是,概念驗證也會所以遭遇風險,成爲受到過多關注的犧牲品。你能夠採起一些措施,確保你的概念驗證持續保持成功,爲更普遍的人工智能戰略提供支持:

  • 縱向擴展推理能力。人工智能不是以線性方式擴展的——例如,從單節點配置遷移後,50 個處理器並不必定會帶來 50 倍的性能。你仍然須要利用在單節點配置中採用的不少方法來測試和優化多節點配置。
  • 縱向擴展更普遍的基礎設施。爲確保人工智能得到成功,你須要驗證推理鏈路中的每個環節。檢查現有的技術平臺、網絡和存儲,以增長可用的數據量,改善時效性和延遲。此舉將最大限度減小將來遭遇瓶頸的可能性,同時最大限度提升從數據源中得到的價值。
  • 調整和優化概念驗證解決方案。隨着時間推移,你會積累更多的技能,用於提高和加強你所部署的人工智能解決方案。爲了得到更好的結果,你能夠優化數據監管和打標籤等領域的軟件,也能夠嘗試訓練和部署新模型。
  • 橫向擴展至其它業務場景。你的概念驗證可能涵蓋其它業務領域的應用,例如預測性維護解決方案以前被部署到製造環境的某一個區域,如今可對其實施擴展。你能夠採用一組方法來管理如何在更普遍的用戶羣內擴展概念驗證。
  • 管理和運營規劃。就本質而言,許多人工智能應用案例都要求系統實時執行推理,而不是在離線或批處理模式下執行。此外,隨着時間推移,可能須要從新訓練並更新模型。這些因素對服務交付提出了一些額外要求。要確保預先分配了足夠的時間和技能資源,以便繼續提供概念驗證。

本文內容來自英特爾

相關文章
相關標籤/搜索