海闊憑魚躍:記一場工業場景下的AI技術實踐

本文由 【AI前線】原創,原文連接:t.cn/RHoI2Rcgit


做者|朱武算法

編輯|Emily編程

AI 前線導讀:「相好比火如荼的消費級人工智能,AI 技術在工業和製造業的發展與落地卻顯得不溫不火。工業智能雖隸屬於弱人工智能,但在某種程度上,其高度的「自治性」與「獨立性」應被施以更多關注。例如,工業機器人一般被設計用來執行特定的細分任務,而現代機器人則被授予了新的使命:作出實時決策。緩存

在採訪今天的主角——天澤智雲首席架構師朱武 前,工業智能、虛擬智能體、工業互聯網等概念似乎如盤根錯節般難以被釋清,這同時也反映了工業智能背後的技術發展成爲咱們關注的空白區之一。因而,帶着對工業場景的機理、工業智能背後的數據提取、建模、訓練等技術挑戰、智能決策系統技術架構的疑問,咱們開啓了此次好奇心之旅。」安全


開篇:爲工業智能正義網絡

還記得在《機器之心》中,做者雷•庫茲韋爾闡述了一幕大膽的預測:將來的世界,人類和機器將難分彼此,人類將再也不是萬物之靈。架構

若是將人工智能應用看做最終呈現的產品,那麼決定「產品質量」各項要素的五個方面則造成工業智能的五要素模型——「人機料法環」。在舊有理解中,人做爲活動第一驅動力而存在,與其餘四要素並不一樣屬一個範疇內。但在工業智能實施的狀況下,生產組織方式發生了變化:併發

朱武解釋說:「在這個模型中,活動做爲一個虛擬的智能體,人在活動中的重要性弱化,活動的第一驅動力來自於反應活動的數據(知識)。這是智能在工業上應用所帶來的最大變化和意義所在。」雖然從目前技術發展角度來講,絕大多數工業場景應用還達不到這種徹底虛擬、徹底智能的程度,但朱武強調,生產組織方式變化對應着智能應用方向的革新,從而直接影響了分析、建立系統的方法和流程。框架

而說到這裏,咱們並不是想強調假大空的概念。定義工業場景的機理對於構建活動虛擬智能實體具備很是重要的基礎做用。機器學習

能夠看到,國內目前並不乏爲工業領域提供 AI 解決方案的企業,林林總總包含了大數據公司、雲計算廠商等同胞,但可能多半並不能清晰地定義工業場景的問題域,或很難從特定知識和數據維度進行工業場景分析。

好比用戶須要對生產線進行優化,那就須要對具體產線進行分析,影響產線的主要是設備問題、工藝問題、仍是人員問題?這是界定問題域的過程;再好比肯定了問題是預測齒輪箱的故障,那就須要知道齒輪箱的構造、運轉方式及工況,故障模式和相應的故障現象,這是爲分析問題所涉及的實體對象的領域知識。

總結來講,工業場景的機理定義須要依賴於合理層次和顆粒度的問題定義,得到相關性的數據集,最終造成問題到數據集再到特徵的映射。

但同時,目前的工業智能還處在初級階段,大部分場景下還作不到徹底智能化,但只要具有活動優化、自適應等特色的系統,均可以屬於工業智能應用的範疇。


黃沙百戰穿金甲——工業智能實現背後的技術挑戰

問題域的肯定和分析方法等衆多環節的聯結,會致使工業智能實現上所面臨的技術挑戰或遠高於消費級人工智能所對應的難題。

例如,在 2015 年通用電氣(General Electric)推出 GE Digital 時,GE Digital 的 CTO Harel Kodesh 就提出過:工業數據不許確、工業智能對風險控制和響應能力的高要求、終端處理能力的限制、複雜模型必須被解釋等顯示了工業智能與消費人工智能的重要區別,這也致使了在數據、算法和模型訓練上工業智能所要開闢的一些「新領域」。

在採訪中,朱武爲咱們解釋了數據特徵提取、建模等層面的技術挑戰:

工業數據的多源性、複雜性和動態性強,好比柴油機氣缸排氣溫度,取決於燃油、燃燒、進氣溫度、封閉性等等,所以,特徵提取要求在高背景噪聲下必須實現準確且快速的降維。另外,在數據建模及訓練層面,工業應用的碎片化、個性化以及結果的專業性,須要建模及訓練在總體和個體、通用性和個性化之間取得均衡。

那麼,實現人工智能所依賴的關鍵技術多如牛毛,數據感知、大數據、機器學習、自動控制、仿真等該怎樣地更好應用在工業智能中呢?朱武認爲,從工程實現的角度,工業智能實現的關鍵有以下幾步:

  1. 定義工業場景:正如上文所說起,問題域所涉及工業場景定義的準確性和完備性決定了該問題在多大程度上被解決的可能性;
  2. 數據的完備性和質量:工業現場數據通常帶有不少噪聲,而數據範圍和質量決定了後續處理的難易程度和最終結果的準確性;
  3. 智能應用支撐環境:工業智能應用自己就具有碎片化、個性化、專業化的特色,如何提供快速有效的應用實施環境,包括數據環境、模型研發實驗環境、應用部署環境等,決定了工業智能應用的推廣和客戶接受速度。

美國早在 2006 年提出了 Cyber-Physical System(CPS), 也就是「信息 - 物理系統」的概念,並將此項技術體系做爲新一代技術革命的突破點。

依照美國 NSF 智能維護系統中心創始主任李傑教授、天澤智雲 CTO 劉宗長共同發表的《工業大數據:挖掘「不可見世界」中的價值》一文中的闡述,CPS 是一個具備清晰架構和使用流程的技術體系,針對工業大數據的特色和分析要求所構擬的技術體系,其可以實現對數據進行收集、彙總、解析、排序、分析等全套處理流程,實現對工業數據進行流水線式的實時分析能力,並在分析過程當中充分考慮機理邏輯、流程關係、活動目標、商業活動等特徵和要求。所以可做爲工業大數據分析中的智能化體系的核心。

                                                 CPS 的 5C 架構


因而,智能決策系統孕育了

在朱武看來,雖然 CPS 帶有仿真環境的屬性,但其很大程度上具有了智能性,「在工業場景下,不少細節須要機器或系統具有自動學習與調整的能力」。此外,CPS 內含協做概念,是實體虛擬空間的映射,而且使得實體設備與虛擬設備之間造成關聯性和相互影響——朱武稱之爲自協做。

而工業智能機理的特定性、工業智能應用實施速度的提高(避免算法選型、數據診斷處理的大量耗時)以及標準化其實施和方法的需求,使得智能決策系統的研發和上線成爲必要,天澤智雲工業智能決策系統的誕生也是基於這樣的背景:

  1. 爲將工業領域知識模板化:朱武強調,工業智能的決策分析比較依賴於工業相關的領域知識、計算機科學和智能建模技術,但同時具有這三個方向知識的人員較少,因而將工業領域知識模板化將成爲必然,從而下降實施工業智能的難度;
  2. 縮短工業智能應用研發和部署的週期:工業智能應用講究快速反應的能力,實施速度的提高,若是在一套系統中像算法、軟件實施、系統實施這類的技術層能夠公用,那麼能夠大大縮減開發時長。
  3. 於是天澤智雲就讓智能決策系統提供數據接入、數據存儲、模型發佈和應用發佈的功能支持,基本分離計算機科學和數據科學,從而數據科學家能夠專一模型開發;
  4. 支持構建標準化的解決方案:朱武分析說,目前對於不一樣行業有定製化需求的不一樣企業,因爲數據環境、數據質量及業務應用的複雜程度不一樣,從定義模型到應用的部署實施是須要 2-3 個月的週期,遇到新的應用場景則會耗費 3-4 個月。工業場景的不肯定性太多,於是在智能決策系統中設定支持相關方法如特徵提取、數據處理、場景定義等實施顯得十分必要,一個標準化的實施方法和解決方案能夠推進整個行業的發展,從而擺脫工業智能初級階段「獨樂樂」的窘境。

目前,CPS 的 5C(智能感知層、信息挖掘層、網絡層、認知層和配置執行層)在智能決策系統中有這些對應實現:

  • 對於智能感知層:智能決策系統經過邊緣計算端點支持現場數據的接入;
  • 對於信息挖掘層:支持任務化的數據遷移,支持各類數據源的動態接入和掛載;
  • 對於網絡層:提供基於實體語義的數據訪問;
  • 對於認知層:支持算法和模型的測試、試運行和發佈;
  • 對於配置層:支持各類業務服務的集成。

但同時,朱武也坦言,受制於現階段國內工業智能發展的侷限性及各場景間的零碎性,再加上 CPS 體系的複雜性,目前的智能決策系統都不能稱之爲 CPS 的所有實現。


智能決策系統如何用技術實現智能決策?

因爲受工業環境不一樣種使用場景的約束,天澤智雲會根據部署環境和業務場景的不一樣採用差別化的技術實施手段,於是,智能決策系統的技術架構也須要根據特定情境來調整。下圖是天澤智雲智能決策系統頂層功能架構圖的全貌:

                                                 天澤智雲智能決策系統功能架構

從功能架構圖中能夠看到,智能決策系統分紅了數據分析與設計、計算環境、CPS 協做集成引擎、服務環境、數據接入、數據持久化及業務應用 APP 等多個模塊。

朱武補充道,拋開功能架構不談,智能決策系統的技術架構設計需重點考量三點:

  1. 關注技術的可替代性。由於新技術的不斷迭代、專爲工業場景定製的 IT 通用解決方案的缺失以及各家使用技術棧的不一樣,決定了架構設計上不該作到高技術耦合性。
  2. 實現 CPS 概念的映射。從數據組織、服務組織層面上看,朱武認爲應使總體的決策系統體現出動態協同或自組織概念。
  3. 將計算環境與服務拆開。朱武解釋,拆開的緣由是想體現兩種不一樣性質服務的概念。通常的服務環境併發性是橫向擴展的,但計算環境中的服務執行在擴展性和併發性上體現的策略不一樣,另外再加上算法間的強依賴性,於是致使必須將計算環境與服務環境區隔開來。以實現風場風功率預測功能爲例,其實現以下圖所示:

整個結構分爲對外的基於功能切面的服務與內部基於虛擬實體資源組織實現。在外部請求時,首先經過 API 網關,基於服務註冊與發現,查詢與定位服務,當風功率預測服務未啓動時,服務註冊與發現通知服務調度,服務調度建立並啓動風功率預測服務。風功率預測將具體功能,如風場總輸出功率預測、單風機輸出功率預測等,請求各自的虛擬實體資源。虛擬實體資源,能夠視爲具有對外提供數據能力的虛擬化設備,該虛擬設備從邏輯上組織相應的數據接入、基於數據持久化的數據集、相應的計算任務,同時,可按照用戶定義的策略,結合數據接入的實時狀態數據,自動執行、管理其行爲。


智能決策系統中的高併發和高可用問題

工業場景中,數據質量、數據全面性和數據精準性問題是不少企業的「燙手山芋」,「利用數據建模的手段解決某一問題時,須要獲取與被分析對象相關的全面參數」,這也使得智能決策系統的計算環境一環須要面臨高併發和高可用的挑戰。

固然,須要澄清的一點是,這裏指的高併發和高可用與傳統意義上的意思有所區分。按照朱武的解釋,工業智能的運行場景一旦場景明確化以後,併發量的大小是能夠提早預知且明確的,因此高併發的嚴格指代是——考慮在不一樣業務場景下不一樣的負載該如何設置,如何優化調度策略和服務組織,使得單個應用實例跑的更好,從而解決資源的高效利用。
一樣,高可用一般指經過設計減小系統不能提供服務的時間。但工業智能計算環境中因爲算法裝載等問題,致使沒法全然判定服務出錯的時間,或實現對服務有效性的精準判斷。

工業場景,解決高併發問題實質是提高效率,而提升效率的關鍵點之一即實現數據的內聚性。智能決策系統除了常見的設計策略外,根據工業場景的特色,朱武團隊採用了數據區塊化的設計方式:

工業智能應用通常是按照實體對象去採集、存儲和訪問數據,所以數據具有局部化特性。

朱武解釋說,對於採集數據,一般狀況下是在用分佈式緩存 Redis 前用哈希映射到某一數據節點,而且最好使可執行節點和數據在同一個本機上,實現一樣的機制映射,同時再設置相對合適時間閾值,這樣就能夠作到更好的分配。

另外,還可經過資源抽象的方式解決高可用問題,即讓運行資源和運行實體分離來,動態按照需求調配運行資源。

該環節實際上可理解爲計算節點重複利用問題,儘可能讓計算節點按照實際需求而分佈。例如,請求接入後可從資源管理中得到資源空閒結果,採用調度策略找到相對應的節點,從而直接與計算節點創建關聯。執行過程當中,還可經過服務監控和靈活調度及時發現問題。

所以,在智能決策系統中,計算環境做爲提供算法、模型的管理、運行和調度平臺,(從業務場景來看)須要具有以下特性:

  • 算法、模型依賴於不一樣的運行環境和組件包,集成時的形式存在多種形式,所以 計算環境需具有不一樣編程語言與框架的算法、模型集成能力;
  • 計算環境應採用特定的算法、模型狀態管理機制,用於服務治理。 對一部分算法、模型的執行,不太適用時間閾值的方式;
  • 算法、模型執行效率,涉及算法、模型間的數據共享和協做,以及算法、模型內部中間結果的傳遞策略;
  • 計算環境須要部署在不一樣的運行環境中,要求 計算環境可以根據實際需求伸縮和選擇性部署的能力。

數據接入實現了現場數據、系統邊界外數據接入系統的能力,根據工業數據應用的特色,數據接入須要具有以下特性:

  • 多種協議集成和採集策略的實施:IoT 在接入數據層會有各類各樣的協議,所以須要將不一樣的協議進行集成。另外就是採集策略也是變幻無窮,但要想推動標準化和品牌化就會使得不少採集策略失效,於是目前的解決方案也只能靠人工解決。
  • 多種時效性數據的雙向傳輸: 在天澤智雲目前的業務場景中,有上傳和下傳兩種時效性傳輸。上傳涉及到狀態數據、振動產生的文件或數據集等,下傳數據包括指令數據和更新。
  • 錯峯控制: 在上傳和下傳實時數據時,可能會遇到數據積累和堵塞狀況。底層傳輸機制的實如今部分 IoT 組件上並未最大程度上優化實時性。所以,業界有用到組態軟件來解決該類問題的方案。但組態自己來說是組織態勢,組態軟件是指可配置、可調整的軟件系統,並不指實時性。因此數據接入的時候,很容易會面臨 物理上同一個鏈路的競爭,因此須要適當控制。

此外,數據接入還面臨到不穩定狀態下的數據可靠傳輸、數據預處理(包括質量過濾)、實體信息和背景信息融合等多維度的技術挑戰。

以智能風場的能量管理系統爲例,其須要的數據接入以下圖:

從上圖能夠看出,其數據來源、數據鏈路、數據通訊協議及時效性、安全性約束的多樣性。目前,天澤智雲是軟硬結合來解決和完成數據接入的問題。經過邊緣計算、工業物聯網網關、PLC/SCADA 這些硬件設施解決部分接入,在軟件層面經過通訊代理、總線技術解決另外一部分數據接入。總的來講,仍是亟需行業和政策的共同推進,從根源上統一技術棧,實現智能接入的真正落地。


如何將人才真正「適配」到工業智能中

在採訪過程當中,朱武與咱們屢次談到了工業場景機理的特殊性和差別性,兩者決定着工業智能的推進不只須要從業人才具有數據、算法等技術技能,同時還要面對着各類工業領域新知識的「侵襲」。這就對挑選合適人才、使新晉成員更快得到成長等方面提出了更多挑戰。

朱武重點闡述了他們的三點培養方法:

一是給予成員清晰的定位,規劃、設定其所處的技術維度,在技術上爲其劃分精確的方向和專業,與其共同謀劃好職業成長路線;朱武團隊內部目前沒有采用一帶一的傳統成長計劃,而是一般分三人小組,分配任務時以團隊爲單位進行,從而促進其小組內部的技術交流氛圍,讓每一個人得到更快的成長速度。

二是強調技術分享和輪崗制。朱武團隊很鼓勵在某一個技術領域有了必定積澱後,爲得到更充分的應用和解決方法而參與到另外一個技術領域的構建中,從而實現技術上的自由轉換。

三是充分信任,作到合理的任務分配。工業智能沒有更多的捷徑和投機取巧的方式實現落地,不管在技術層的突圍仍是人才層的吸納,腳踏實地是關鍵。這也是採訪中朱武不斷強調懂工業機理重要性的緣由。


採訪嘉賓介紹

朱武,天澤智雲首席架構師,承擔過多項國家重點型號科研項目,擅長工業領域的軟件系統開發、測試和架構設計。曾就任於中國船舶系統工程研究院,主導並實施海軍後勤裝備保障體系信息化建設;做爲總架構師與 IMS 共同合做,參與船舶智能運行與維護(SOMS)系統等多個智能化系統的架構設計和實施。

關注後回覆「AI」你懂的

相關文章
相關標籤/搜索