胡亞海 數據庫
首席技術官 CTO 安全
北京航空航天大學 博士架構
深耕互聯網領域近20年,前後任職於普天信息技術研究院、摩托羅拉、宇龍酷派、百度等知名企業,曾主導宇龍酷派公司全員從WinCE向Android轉型,並做爲百度移動雲技術委員會成員,參與核心架構設計和業務規劃。在手機系統研發、雲生態技術架構與業務規劃等領域擁有豐富經驗,擅長技術體系搭建、大數據平臺、運維與雲服務平臺化。運維
今天很是有幸採訪掌衆金服的胡總,就掌衆金服的業務發展和信貸風控的自動化實施進行了交流。工具
信數:請胡總簡單介紹下掌衆金服和主要的業務。性能
胡亞海:掌衆金服成立於2014年10月,是一家技術驅動的Fintech公司, 專一大數據風控和金融科技研發,致力於打造開放的金融雲生態平臺,爲不一樣羣體提供高效便捷的智能金融服務和解決方案。公司有着優點互補的團隊,管理層來自大型銀行、投資機構、互聯網巨頭公司等,目前員工中65%是技術人才。大數據
信數:您能談談中國互聯網金融科技行業還有哪些機會?將來的趨勢是什麼?加密
胡亞海:「觀其變易以順勢而爲」,互聯網已經叩響「萬物互聯時代」的大門。站在時代前沿,金融科技成爲鏈接傳統金融行業和智能化的根基,點燃了中國金融創新的引擎,促使金融業釋放出史無前例的活力。架構設計
隨着行業的不斷髮展,將來將有更多的企業「以持續技術創新」爲核心驅動力,從而夯實平臺在高效價值傳遞、數據驅動及消費場景適配領域的優點,並構建全生態金融產業鏈。與此同時,基於「中國科技服務世界」的信心,將會有其它更多國家共享中國金融科技的先進成果和經驗。設計
信數:請您簡單介紹一下掌衆金服的大數據風控系統。
胡亞海:基於創新型海量大數據採集、加工技術。多重信用評估模型及風控維度,對客戶准入進行風險定級。
安全性:經過了公安部信息系統安全等級保護三級安全認證。高性能、高可用性,支持PB級的數據存儲及3000萬+用戶的全量用戶活動的峯值訪問量。
信數:掌衆金服在哪些環節改進決策效能?
胡亞海:全自動化的線上風控流程,極大下降運營成本;基於大數據的技術體系,提升數據採集、清洗及信息提取的效率;多維度的風控模型有效提升模型準確度。
信數:使用 SparklingLogic 決策引擎的優點是什麼?
胡亞海:基於硅谷的專業決策引擎 SparklingLogic,有着以下優點:
1) 高性能。單臺主機的決策接口調用量QPS便可達到上千。
2) 便捷的規則錄入及版本管理。規則錄入語法簡單,同時支持可視化工具進行規則錄入。規則的每次變動均有相應的歷史記錄。
3) 規則發佈靈活。發佈時選擇相應的版本便可,且支持熱部署,規則更新無需中斷服務。
4) 完善的權限管理。支持帳戶及對應的工做區權限隔離。
信數:掌衆金服是如何處理、加工、管理海量數據?
胡亞海:基於HBase的數據存儲,使用流式計算(Spark Streaming、Storm)對數據進行分析,經過Hive等數倉進行報表輸出。數據流轉過程當中對敏感數據進行加密或脫敏。
信數:如何自動化處理進件,快速評估貸前、貸中、貸後的客戶信用?
胡亞海:觸發客戶信用評估的場景主要有用戶提交授信數據、點擊借款申請、借款訂單狀態變動(生成借款、還款或逾期等)。每一個場景發生後都會觸發相應的我的特徵變量更新及模型的運算,基於高效的風控系統,能夠快速地完成客戶信用評估。
信數:決策系統有哪些模型在運行?舉例說明。
胡亞海:主要的模型有貸前反欺詐、貸前信用模型、貸中風險模型及貸後催收模型等。例如貸前黑名單攔截即屬於貸前反欺詐中的一個。
信數:個貸方面,模型的數據維度有哪些還須要補充?
胡亞海:目前模型已有的數據維度可實現爲用戶進行比較準確的風險評估。但針對人行徵信等具備極高公信力的數據,若是提交的用戶更多,對模型的準確度會有必定程度的提高。
信數:您關注的大數據決策系統的監控指標有哪些?
胡亞海:指標主要分兩大類。第一類是系統性能指標,包括對外接口的響應耗時、授信數據處理吞吐量、數據庫查詢耗時等。第二類是業務狀態指標,包括拒貸率波動、交易量、授信成功率等。
信數:對於大數據決策系統,個貸有哪些新的難點?
胡亞海:系統層面,隨着用戶量的增加,對IT基礎設施及系統提出了更高的要求:高性能、高可用性及成本控制。風控策略方面,須要更好地利用大數據、精確地風險評估及反欺詐。
信數:如何獲取客戶?客戶體量有多少?
胡亞海:目前獲客方式有廣告投放、合做夥伴導流等線上渠道。目前註冊用戶達到了3000萬+。