專訪宜信AI中臺團隊負責人王東:智慧金融時代,大數據和AI如何爲業務賦能

前言:宜信技術人物專訪是宜信技術學院推出的系列性專題,咱們邀請軟件研發行業的優秀技術人,分享本身在軟件研發領域的實踐經驗和前瞻性觀點。前端

第一期專訪咱們邀請到宜信科技中心AI中臺負責人王東老師,從大數據和AI賦能金融業務的角度,分享了中臺、大數據、AI等軟件研發趨勢爲業務賦能的經驗與思路。算法

王東老師從技術視角到業務視角,在中臺的落地契機、AI與大數據關係、AI和大數據技術的落地等方面提出了本身的見解。數據庫


記者:不少人將金融行業的發展劃分爲三個階段:信息金融時代,主要指銀行卡的出現,銀行開始作集中的數據管理;互聯網金融時代,互聯網的發展,使得用戶能夠經過PC和APP辦理金融業務,這一階段金融機構經過數據平臺管理和使用數據;智慧金融時代,也就是如今,金融機構經過大數據和AI技術讓金融服務智能化。安全

做爲有多年金融行業經驗的大數據專家,您認爲在這3個階段裏,數據爲金融服務賦能的方式出現了哪些變化?分別有哪些典型的產品化表現?架構

王東:按照DIKW體系, 這三個階段對應的是數據電子化、數據信息化、數據知識化和數據智能化的過程。併發

  • 信息金融時代,金融機構都在進行金融基礎設施建設,數據被集中化管理,金融機構從手工勞動和紙質單據中解放出來,提升效率,本質上這是電子化、信息化的一個過程,金融機構的數據進行結構化和梳理,並被分析和使用。這個階段數據倉庫和數據集市的理論體系誕生並獲得完善,基於數倉理論體系的軟件工具發佈,數據的BI分析(使用ETL、創建數據倉庫、OLAP分析和可視化報表)在金融機構中最早開始落地併產生價值,基於數據的早期信用卡風控模型開始創建並投入使用。機器學習

  • 互聯網金融時代,是數據爆炸的時代,雲計算和大數據技術興起,金融機構面臨業務變化快、大數據量、高併發量等各類不一樣需求的衝擊,前端業務系統進行大規模改造以適應大數據的衝擊。數據層面上,企業的數據量已經變得很是龐大,業務變化也很是快,傳統的報表迭代速度慢,須要排期,沒法知足金融機構的數據分析需求。大數據理論和大數據分佈式平臺蓬勃發展,基於大數據平臺的相關技術讓敏捷式報表的概念逐漸成爲可能,數據實時化、自助化深刻人心。BI的流程已經大幅縮短,在金融機構的決策中被普遍使用。大數據技術、機器學習等技術在金融領域的引用,催生了大數據風控技術、反欺詐分析、精準營銷和個性化推薦、銷售渠道優化&產品服務優化、輿情分析等智能應用。分佈式

  • 智慧金融時代,是數據知識化和智能化的高級階段,大數據和AI能力重塑和改造金融服務,創造業務,下降成本,提升效率。金融機構業務部門的數據分析需求進一步增長,商業智能分析產品被業務專家普遍使用在輔助分析、協助決策、智能助理等各個領域。BI分析更加自動化,加強型分析(是數據準備和洞察過程自動化、使用天然語言或語音交互、根據AI分析給出決策建議、利用機器學習和AI管理數據)逐步成爲可能。基於大數據和AI提供的各項能力,客服機器人、外呼機器人、智能投顧、智能投研、客戶流失預測、績優銷售預測、千人千面的金融產品等變爲現實。

記者:智慧金融時代,AI技術在金融服務的落地場景也愈來愈多。您可否以宜信的某一個AI產品爲例,簡單介紹AI在金融服務業務場景中的落地實踐。高併發

王東:這裏,我就介紹一下咱們智能聊天機器人平臺吧。該平臺是結合天然語言處理、搜索引擎、會話領域場景的一站式人機對話解決方案,只需簡單導入本身的業務問答數據知識,系統的智能模型就會快速學習並生成相應的機器人,建立出定制化的業務諮詢專家。工具

智能聊天機器人平臺包含QA聊天機器人、任務機器人、閒聊機器人、人工後臺、文檔管理、模型管理、會話管理、統計報表等諸多功能。平臺支持多租戶,對算力、數據和資源進行隔離。對接公司LDAP、SMP、SSO等認證系統,支持功能角色和數據角色,對業務系統無侵入,能夠內嵌到公司PC端業務系統中或手機APP中。

以CSC場景爲例:CSC的一線同事在平常工做中,天天都會產生大量業務問題須要諮詢。此前這些問題經過蜜蜂等IM軟件在工做羣內進行詢問,由CSC客服管理部相關同事支持。但因爲問題數量大、涉及業務線多,這些業務諮詢每每不能獲得迅速解決,影響業務的順利開展。另外一方面,經過人工進行業務問題支持的工做還存在着響應緩慢、效率不高、成本高昂等問題。最終從客戶角度來看,業務問題的沒法解決或解決流程不規範,將嚴重影響客戶體驗和品牌認知。

使用了智能問答機器人後, 門店客服能夠經過智能機器人快速獲得一致性答案,經過搜索引擎快速檢索到業務文檔相關資料,當遇到機器人沒法解答問題,能夠將問題轉入人工後臺。讓大部分常見問題由機器人代勞,少部分複雜的問題轉後臺人工處理,經過智能機器人+人工後臺的方式,共同提供完整的快捷的一體化用戶體驗。

因爲智能聊天機器人平臺是按照平臺化方式來建設的,所以很容易推廣到公司其餘須要智能聊天的場景中,除了CSC客服問答機器人之外,目前已經在公司車貸客服問答、催收業務諮詢、財富智能問答、指尖金融家APP和信審業務諮詢等領域中上線和使用,成爲客服管理重要的平常工具,實現了運營管理智能化從0到1的過程,幫助運營人員減輕壓力,提高運營效率。

金融領域正掀起一場智能化的變革,智能聊天機器人在這場變革中將扮演重要角色。衆多分析師認爲,聊天機器人的商業化應用,其真正潛力正是在金融領域。除了對企業內部業務的智能化支持,更加使人興奮的是聊天機器人與金融的結合將完全顛覆我的金融服務的形式,相信在不遠的未來,智能金融機器人將在客服、諮詢、理財、支付等各類場景下提供更加科學而天然、理性兼具人性的服務,這也是咱們平臺的最終發展目標。

記者:智能化的AI產品能夠解決複雜多樣的業務問題,但面對衆多的需求,須要進行優先級排列,您和團隊是如何判斷業務問題優先級的呢?

王東:就能力分層來講,咱們認爲智慧化AI產品能夠分爲三層:

  • 最底層——AI平臺層:提供在線訓練、在線標註、特徵工程、自助訓練、算法庫、訓練環境等AI基礎設施。服務的對象是AI科學家和數據科學家,爲他們提供平臺和工具支撐。

  • 中間層——AI服務層:提供語言合成、詞法分析、類似度比較、觀點抽取、卡證票據類識別等通用AI服務,以及與業務方合做的智能服務項目。服務的對象是咱們各個業務系統,爲各個業務系統提供AI能力支持,助力業務發展。

  • 最上層——AI產品層:提供相似智能聊天機器人平臺這樣的端到端解決方案。服務的對象是咱們的一線業務同事、甚至多是咱們的客戶。

從技術難度來講,最挑戰的是最底層-AI平臺層,打造一套本身的在線訓練平臺一直是不少AI科學家和數據科學家所期待的,但打造一套很是好用的在線訓練平臺並不容易,須要投入大量人力和時間,維護成本也很高,須要增長最新算法庫等,對使用的用戶要求也比較高,通常都是算法工程師和科學家。咱們的業務方對這個通常沒有什麼感知。

從業務影響力和優先級來講,最上層和中間層的優先級會更高一些,這兩層主要是爲公司一線業務系統服務,會直接或間接觸達到一線業務同事或客戶,直接產生商業價值和下降成本。

做爲AI中臺來講,在有限的人力狀況下,咱們會更優先支持最上層和中間層的AI服務,例如:聊天機器人平臺、語音合成、主題提取、卡證類識別等通用類AI服務以及與業務方合做的智能服務項目。而對於最底層AI平臺,咱們也會在平常工做中,經過積累和沉澱能夠複用的工具集,逐步造成相應平臺能力。

記者:據悉,宜信的智能聊天機器人平臺是基於AI中臺研發的,那麼AI中臺爲智能聊天機器人平臺的研發提供了哪些優點呢?相比AI中臺建設以前,有哪些地方獲得了改善?

王東:從AI中臺的使命來講,AI中臺承擔一些跨領域的、平臺級的服務研發和推廣,避免煙囪式的開發,強調開發合做、通用性和可複用性。智能聊天機器人平臺就是這樣一款產品,它具備平臺的通用性,能夠內嵌到公司各個業務系統中,以天然語言的方式提供問題諮詢、任務執行、業務解答等支持,最終達到節省人力,降本增效的目標。

智能聊天機器人在AI中臺開發是有諸多好處的:

  • 從人員方面來講,智能聊天機器人涉及到天然語言處理、語音轉換等技術,這須要在NLP和語音識別等專業領域深耕的AI科學家來支持。一方面機器人平臺能夠藉助AI中臺的AI科學家經過更好的算法讓聊天機器人更加智能,更加多樣化,另一方面機器人平臺也爲AI中臺的專業AI人員找到了合適的用武之地和實踐場景。

  • 從平臺層面來講,智能聊天機器人所須要的模型服務是能夠向下沉澱的,通用化後成爲AI中臺的AIHub模型服務平臺。 這樣聊天機器人平臺沒必要關心模型管理,只須要關注本身聊天機器人領域的事情,例如模型服務、模型編排、模型監控預警等這些模型通用能力的事情交給AI中臺的AIHub模型服務平臺來解決。實現產品模塊邊界清晰,並提升複用性和專業度,減小重複建設。

記者:宜信技術學院組織了2次直播分享,主題分別是數據中臺和AI中臺,您在這兩個項目都扮演了重要的角色,如今也愈來愈多的人提到數據中臺須要向AI中臺演進,您對此怎麼看?宜信的數據中臺和AI中臺之間是什麼樣的關係?兩者之間是如何支持協做的?

王東:數據中臺除了提供數據平臺自己的兩大能力(數據存儲和數據計算)之外,還提供了更高級的能力,就是把數據變成一種基礎服務提供給業務方,業務方能夠以自助的方式在數據中臺上獲取數據,進行數據處理、數據探索、數據挖掘、分析鑽取、多維分析、自助化報表、數據分享等,以快速的實現本身的商業價值。

隨着業務的發展,愈來愈多的智能化數據需求被提出,這些智能化需求涉及到模型訓練、數據標註、特徵工程、模型部署、性能監控等,須要使用機器學習、深度學習等算法支持。數據中臺的主要目標仍是服務數據,對於智能化和模型並不能很好地支持,所以AI中臺應運而生。

咱們把智能服務的需求抽象出來,造成一個獨立的AI中臺層。AI中臺是一個用來構建智能服務的基礎設施平臺,對公司所需的模型提供了分佈分層的構建能力和全生命週期管理的服務,鼓勵各個業務領域基礎性、場景性、通用性的AI能力沉澱到平臺中,增強模型複用、組合創新、規模化,最終實現降本增效和快速響應業務方。

數據中臺和AI中臺二者是相互依存,承前啓後的關係。

  • 數據中臺和AI中臺二者都對外提供服務,只是側重點不一樣:數據中臺提供各類數據服務(BI報表應用、數據探索等),AI中臺提供各類智能服務(模型預測、智能推薦等);

  • AI中臺依託數據中臺提供的數據能力和工具集,加速AI相關服務的開發和複用,來應對前臺智能業務需求。有了數據中臺清洗好的數據,搭建智能項目事半功倍;

  • 數據中臺也須要使用AI中臺的智能化能力使得數據使用更加平民化和智能化。例如加強型BI分析:通用天然語言交互方式,下降BI使用門檻;經過AI分析給出參與建議,幫助普通用戶在沒有數據專家的狀況下有效訪問數據;加強型數據管理:利用機器學習來管理數據,包括數據質量、元數據管理;主數據管理等。

記者:從去年開始,彷佛每一個公司都在談中臺,但其實不少人對中臺的具體價值還不是很理解,從宜信的數據中臺和AI中臺這兩個項目來看,中臺在賦能業務方面有哪些優點?請您舉幾個例子具體介紹。

王東:在「以用戶爲中心」的思想指導下,企業須要快速響應、挖掘、引領⽤戶的需求,藉助平臺化的力量能夠事半功倍。後臺並不爲前臺而生,要麼很差用,要麼變動速度跟不上前臺的節奏。就算是新建的後臺系統,由於其後臺管理的屬性(考慮到企業安全、審計、合規、法律等限制)致使不能適應前臺快速開發的需求。前臺和後臺就像是兩個不一樣轉速的⻮輪,前臺要快速響應,後臺則要求越穩定越好。

所以中臺應運而生,中臺存在的目的就是更好地服務前臺,進而更好地響應服務。在宜信,數據中臺和AI中臺也一樣是爲了更好更快地服務前臺而存在:

  • 以數據中臺爲例:業務領域組數據團隊須要緊急製做一批報表,不但願排期,部分報表須要T+0時效性。數據來源是異構數據庫,對數據時效性要求很高,須要對數據處理後並展現報表。使用數據中臺,業務方不須要關心數據的異構性,不管是實時數據仍是批量數據,只須要懂SQL,業務方均可以在數據中臺上申請數據,自助地寫SQL進行處理數據清洗、數據處理,最後,經過配置和寫SQL生成本身須要報表,不用等排期,徹底自助快速完成。

  • 以AI中臺爲例:AI中臺的智能聊天機器人平臺,對接第一個業務方是從零開始,從研發平臺、模型研發、數據對接、到使用上線第一期,花了6個月的時間,第二個業務方享受到平臺的優點,直接導入數據,進行驗證和對接後,4個月實現上線第一期,以後的業務方更快2個月上線,最近的一個業務方達到3周就上線的速度,體現了平臺的複用性帶來的便捷和快速響應業務方需求的能力。

中臺將前臺業務中相對穩定的能力固化和沉澱下來,並共享給有須要的其餘業務方使用,從而實現快速響應業務需求、下降成本和支持業務方進行規模化創新。

記者:以您的經驗來看,什麼樣的企業須要建設數據或者AI中臺?或者說企業在何時應該要建設中臺,是否有什麼明顯的信號?好比說企業到了什麼樣的階段或者遇到什麼樣的問題。

王東:企業啓動本身的數據中臺和AI中臺建設,是與企業當時的業務發展階段相關的。

不少企業在早期業務發展過程當中,爲了解決一些當時的業務問題,快速上線了不少功能,要麼垂直的、個性化的業務邏輯與基礎系統耦合太深,橫向系統之間、上下游系統之間交叉邏輯錯綜複雜。要麼缺少統一規劃,建設了許多高度類似的系統,大量重複建設,但又不通用,用戶體驗不統一。 這樣致使在新業務、新市場的拓展過程當中,系統無法直接複用,甚至無法快速迭代。

咱們稱爲 「重複造輪子」和「煙囪式架構」,本質上是企業在早期高速發展過程中,爲了快速解決當時的業務問題,而欠下了許多技術債務。這些歷史技術債務積重難返,當企業進入成熟期以後,發現這些問題的存在,嚴重影響了企業的運行效率和運營成本。大多數提出中臺戰略或是建設大中臺的企業,都面臨過相似的困境。

中臺化建設做爲一種產品設計思想或者系統架構思想,對於任何一家即將或者正在面臨業務高速增加的企業來講,都值得借鑑,對目前業務當中大量可複用的功能和場景進行梳理,爲業務的高速增加作好準備,同時也起到了降本增效的目的。

這個過程很像是在飛行過程當中修發動機。一方面,知道飛機發動機已經存在一些問題,須要修理; 另一方面,還在飛行過程當中,飛機還要飛,還要支持業務發展,不可能將發動機停了。這個過程是有必定難度,還要搶時間,爲下一次業務發展作好準備。

經過機制化、產品化等方式,將企業內部具備通用性的數據、功能、產品進行統一規劃和開發,從而更好地幫助前臺業務部門更多地關注業務,提升業務運營效率,進而提高企業競爭力,是企業中臺化建設的目標。

記者:前面您也講到,智能聊天機器人平臺的研發要基於數據中臺所提供的數據挖掘和處理能力,能夠說AI產品的研發和應用離不開大數據技術的支撐。那您認爲大數據技術與AI應用落地之間是一種什麼樣的關係?

王東:縱觀此次人工智能的浪潮,能夠說是算法、大數據等技術和硬件多方面的因素促成的。一方面算法層面有了進一步突破,更重要的是大數據相關技術的成熟,使得數據的獲取變得容易,大數據計算變得可能,之前許多不可能完成的事情,如今能夠經過大數據的算力來進行學習和訓練。再結合如今GPU、AI芯片以及傳感器等硬件技術,使得須要大規模計算的深度學習訓練能夠完成,這些都直接致使了AI應用的快速落地和處處開花。

以互聯網AI應用爲例,互聯網巨頭是使用大數據標註並落地AI應用的最先受益者。AI應用最先應用在搜索引擎(Google、百度)、廣告系統(Ebay)、電子商務網站(阿里)等,它們都是大數據的產生方和使用方,而後是在擁有大數據流的社交平臺(Facebook,騰訊),到如今使用大數據技術在垂直細分領域作個性化推薦平臺(頭條、快手)。一方面你們在使用這些互聯網平臺,另一方面你們也在進行免費的大數據標註。

以商業AI應用爲例,商業機構經過激活已有的大數據,並結合AI算法創造商業價值。醫療機構經過已有病歷實現疾病診斷/鑑別、個性化治療/行爲矯正、臨牀決策支持系統、流行病爆發預測等, 金融機構經過已有交易數據,進行大數據風控、個性化營銷、智能投顧、智能投研等。這些都是大數據與AI緊密結合的產物。

以實體世界AI應用爲例,經過獲取實體世界的數據,實現智能化,帶來新的應用、新的商機。經過大數據、AI與汽車行業結合,誕生了自動駕駛、路徑規劃、實時路況、危險預警等應用;大數據與商業零售結合,收集海量顧客信息,結合AI技術,用於精準營銷、店鋪選址、庫存規劃、個性化服務等。大數據、AI技術與智慧城市、智能安監、環境治理、教育等諸多領域結合後,都帶來了大量新的應用和商業機會。

所以,不管是傳統的數據挖掘、仍是機器學習、深度學習,全部的模型都離不開大量的數據,能夠說大數據技術是AI應用的養料和土壤,大數據技術催生了AI應用的落地。

記者:最後一個問題咱們來聊聊AI的應用前景吧。您以爲如今AI技術是否已經成熟到能夠大規模落地應用了?以金融行業舉例的話,您認爲要真正實現AI技術在金融服務中的全面落地,如今還缺乏什麼?好比技術方面、數據資源方面等。

王東:最近對AI應用討論得挺多,有如下幾種觀點:

  • 「速勝論」:理由是基於深度學習技術的爆發式進步,由AlphaGo完勝人類職業圍棋頂尖水平爲導火索,在圖像領域(圖像識別、人臉識別、視頻識別等)、語音領域(語言識別、語言合成、智能翻譯等)取得了巨大的成功,火熱的人工智能帶來了不少機會,資本的大量涌入,市場上涌現了一大批 AI 初創公司,同時媒體的大肆宣揚,好比說「人類要被機器人取代」「機器開始威脅人類」等等,致使一部分人對AI技術已經可以大規模普及和落地充滿信心。

  • 「投降主義論」:隨着進一步研究發現,許多問題並無解決。例如開放領域的聊天機器人不夠聰明,總體有待增強。主要緣由在於天然語言理解的發展進程並無咱們想象中快,深度學習也彷佛沒有解決這個問題,能夠與人類對話交流的機器人好像從未出現過。有外媒甚至評論道:「我不肯定能不能說聊天機器人死了,由於我不知道它是否活過。」除了上述的一些成功領域,深度學習也並無解決其餘全部領域的問題。

瞭解到人工智能歷史的同行都知道,其實人工智能至今經歷了三次大的熱潮。每次都經歷了開始是「人類要毀滅了」,後來是「騙子」的過程。

實際上,在一個特定領域的優秀表現,並不能表明 AI 技術無所不能。一樣的,在通用領域不能解決的問題,不表明特定領域不能解決。

我更加相信「持久戰論」,羅馬歷來都不是一天可以建成的,技術的突破也必然會經歷必定時間的積累。AI技術在金融服務中的落地,我比較贊同宜信CTO向江旭先生提的觀點「大膽擁抱,當心實踐」。

首先須要選擇金融領域的業務痛點,並經過AI技術來解決這些痛點,把很是炫酷的AI技術落實到實際業務需求中,而不是爲炫酷而炫酷。就目前而言,咱們的AI中臺會選擇在智能機器人和知識圖譜構建上發力。智能聊天機器人能爲公司內外提供專業領域的知識解答,知識圖譜能爲各業務方提供智能問答、智能搜索、精準營銷等。最重要的是,咱們但願按照平臺化的方式去建設它們,但願建設知識圖譜的方法論、工具和平臺可複用。

目前在落地過程當中,除了搭建AI中臺相關平臺之外,花費時間最多的是與數據相關的過程,不管是模型訓練,仍是知識圖譜構建,不少時間用在獲取數據和探索數據。

對於普通的模型訓練,須要多個維度的數據,AI科學家須要對這些數據進行觀察和探索,通常這些數據都是結構化數據,這個問題會隨着數據中臺的成長,數據聚集愈來愈多後,獲得逐步的解決。數據中臺提供自助化探索數據的能力,可以大幅減小獲取數據和探索數據的時間和成本。

對於圖譜構建和天然語言處理,咱們不少的金融數據保存爲非結構化的數據和語料,例如pdf文檔、表格數據、掃描圖片等,一方面要求數據中臺或數據平臺可以提供非結構化數據的獲取能力,另外一方面也要求AI中臺提供對這種非結構化數據進行在線標註、在線提取的平臺級能力。

嘉賓介紹:

王東:宜信科技中心AI中臺團隊負責人

北京大學軟件工程專業碩士,宜信科技中心AI中臺團隊負責人,目前負責宜信AI中臺平臺的建設工做。研究領域方向包括開放AI平臺建設、智能聊天機器人、實時數據歸集和處理、大數據平臺研發和推廣等。擁有10年以上金融和互聯網企業基礎系統和數據類研發經驗。宜信敏捷大數據棧DBus開源項目負責人,CUBRID-cluster開源項目發起人。曾任韓國最大搜索引擎公司——Naver資深工程師,多年負責CUBRID-cluster分佈式數據庫引擎和CUBRID數據庫引擎研發工做。

相關文章
相關標籤/搜索