YEP共享平臺釋放宜人貸無限潛力

背景

宜人貸(NYSE: YRD)是中國領先的在線金融服務平臺,由宜信公司2012年推出。宜人貸通過科技驅動金融創新,爲中國優質城市白領人羣提供高效、便捷、個性化的信用借款諮詢服務;通過「宜人財富」爲大衆富裕階層提供安全、專業的財富管理服務。2015年12月18日,宜人貸在美國紐約證券交易所成功上市,成爲中國金融科技第一股。

而伴隨着近年來「互聯網+」發展的大潮,互聯網+金融市場異常活躍,通過互聯網進行金融服務的支付、在線保險、P2P網貸等互聯網金融平臺數量劇增,發展態勢異常火爆,尤以宜人貸爲代表的P2P網貸發展最爲迅猛。P2P網貸最大的優越性是使傳統銀行難以覆蓋的借款人在虛擬世界裏能充分享受貸款的高效與便捷。據相關資料統計,2016年全年網貸行業成交量達到了20638.72億元,相比2015年全年網貸成交量(9823億元)增長了110%。在2016年,P2P網貸行業歷史累計成交量接連突破2萬億元、3萬億元兩個大關,單月成交量更是突破了2000億元,2016年「網貸雙11」單日再次突破100億元,實現了116.07億元,這一系列的成績都反映了P2P網貸行業仍然獲得大量投資人青睞的事實。但與此同時,以P2P網貸爲代表的金融科技行業也面臨諸多挑戰:由於缺乏精確的用戶畫像和用戶行爲分析,互聯網金融企業的精確獲客及用戶轉化能力成本居高不下;由於沒有統一的徵信體系和信用評價,有預謀有組織的騙貸行爲時有發生,網貸反欺詐任重而道遠;由於缺乏對用戶實際經濟能力、償還能力的有效評估,風控壓力巨大;由於缺少對用戶的精確識別和等級劃分,貸後管理面臨諸多問題,無法實現對優質用戶的利益提升和對劣質用戶的有效的催收。

宜人貸當然也不可避免地面臨同樣的挑戰,爲此,宜人貸基於過去五年在互聯網借貸行業的深度積累和豐富實踐,以及在數據抓取、反欺詐和線上獲客方面的深入投入和研究,推出了YEP共享平臺,爲宜人貸以及其他互聯網金融相關企業提供了一個集數據抓取、數據解析、風險控制、反欺詐、精準獲客、流量共享爲一體的開放平臺。

技術方案

技術選型

宜人貸YEP共享平臺,主要基於Hadoop、Spark等開源技術構建,而之所以選擇Hadoop、Spark這些開源技術,作爲宜人貸首席運營官&首席技術官的曹陽最有發言權,他表示,在選擇技術架構時,宜人貸主要從四個維度考慮,第一,該技術本身是不是很成熟。第二,是不是有大量的人才掌握這種技術。第三,該技術後續的持續發展方向是不是跟宜人貸的發展方向符合,是不是還有可能持續發展。第四,綜合的成本,不僅僅是軟件本身,還包括硬件以及人力成本等。而基於以上四個維度,Hadoop無疑是最好的,尤其是在國內有很多優質的Hadoop人才,而其他一些新的技術雖然也不錯,但由於人才上的匱乏,無法對其進行很好的支持,因此,很難得到廣泛的應用。但宜人貸也在不斷的嘗試很多新的技術,例如Neo4j,就是宜人貸在相關的新技術嘗試中發現的「明珠」。

同時,宜人貸在技術架構的選擇上也非常擁抱像Hadoop、Spark這樣的開源技術,因爲開源技術通常都具有很好的社區支持,有大量的用戶在使用,有很多用戶的經驗可以分享,而通過這些,就可以儘量避免在開發中的許多彎路和跳過許多坑,而這也是宜人貸選擇Hadoop、Spark等開源技術的另一個重要原因。

開發過程

曹陽介紹說,YEP共享平臺的研發採用的是小團隊項目的開發模式,在實際的開發中,實際上是有兩個開發組,一個是基礎架構組,主要負責基礎架構,包括前端、後端、監控、配置以及動態等,這個基礎架構組解決的問題跟業務的關聯性不大。還有一個就是業務組,主要關注業務開發,在這個組中會鼓勵採用模塊化組織化的開發模式,這樣能夠實現很容易的共享,並顯著提高業務上線的效率。而在整個YEP共享平臺的研發工程中,最大的挑戰還是來自於產品的更新迭代和數量增長。例如,原有一個產品,現在變成六個產品,其中四個產品中間還有不同的分支,這樣,後臺的複雜度就會直線上升,數據的需求也會發生很大變化,給用戶的引導也會完全不同,在這樣的情況下,前端就需要重構,前端重構的時候,後端的數據也會不一樣,因此,後端也要重構,這實際上對開發團隊是一個不小的挑戰,而理想的情況是在類似情形發生之前,重構已經進行。

架構解析

宜人貸YEP共享平臺,由負責精確獲客的獲客系統、負責數據抓取的蜂巢系統以及反欺詐系統三部分組成。

圖片描述

其系統架構如下圖所示:

圖片描述

其中,在獲客系統中,採用了Hadoop的集羣,並基於開源的TensorFlow應用了一些相對比較簡單的機器學習算法,主要是對用戶的標籤效果進行評估、實時的優化或者關鍵詞的投放,策略的調整等等。目前,這個基本的模型還比較簡單,但處理速度非常快,而未來,這個模型將越來越複雜。實際上,純獲客不是很複雜,但把獲客和欺詐結合在一起就比較複雜了。比如想通過用戶對消費行爲的問題回答來判斷有用戶是否存在欺詐的可能性,這就需要很多在算法層面的優化,需要與反欺詐系統結合,而不是單純靠獲客系統或者人力就能夠解決的。

在最基礎的數據抓取系統中,YEP共享平臺採用了Hadoop做分佈式計算,HBase做數據存儲。之所以採用Hadoop的架構,是因爲在對用戶進行數據抓取時,數據量本身絕對值較大,同時,數據的維度也很多,比如對於一個用戶,就需要抓取涵蓋了電信運營商、電商、公積金、網銀、信用卡賬單、保單、社保、行爲習慣等多個維度的大量非結構化數據;然後在此之上的關聯的需求也很多,而這樣的需求特別適合於善於處理廣泛分佈的非機構化數據並具有強大並行處理能力的Hadoop集羣和具有分佈式處理能力和強大橫向擴展能力的HBase數據庫。

圖片描述

在反欺詐系統中,需要對用戶行爲的數據進行分析,例如通過用戶使用宜人貸的應用的行爲或是使用其他APP時的應用的行爲數據來爲用戶定義標誌用戶質量優劣的標籤,而這些數據通常是海量的流式數據。因此,在這部分採用了對流式數據處理在性能和速度上都俱佳的Spark,並同樣採用HBase作爲數據存儲系統,並基於Logistic Regression/Gradient Boosting/Graph Mining 等人工智能、深度學習算法對用戶行爲進行分析。同時,在此係統中還應用了一個比較有意思的技術,即基於圖數據庫Neo4j生成的用戶關係的知識圖譜。這個知識圖譜等同於用戶的數據關聯,通過這種數據關聯,反欺詐系統可以對一些用戶定義標籤,比如,如果從收集的用戶的通話詳單中,發現有兩名用戶經常互通電話,而其中一名用戶被系統標記爲欺詐,那其朋友就很有可能也會存在欺詐行爲,而系統就會爲這個用戶打上標籤,而通常,這種用戶之間的關聯並不像上面所舉的例子那樣簡單,而是具有非常錯綜複雜的關聯,這個時候,Neo4j化繁爲簡的能力在這裏就能得到充分的用武之地。此外,YEP共享平臺還在前端提供收集用戶行爲的SDK,這個SDK可以收集包括用戶的輸入、點擊等行爲,而這些行爲也可以用於判斷一個用戶是否在進行欺詐。例如,如果一個用戶在輸入個人信息的時候猶豫不決或者耗費時間過多,該用戶就很有可能是一個想要進行欺詐的用戶,而通過這個SDK就可以判別出這個用戶,這個SDK也是宜人貸的一個創新。

圖片描述

另外,YEP共享平臺在系統層面還大量使用了基於Spring boot的微服務架構,同時也在嘗試一些金融雲服務,但宜人貸是一家上市公司,鑑於金融機構的監管、合規、審計的需求,目前,YEP共享平臺的基礎架構還是搭建在宜人貸自身的服務器之上。

架構優點

YEP共享平臺的基礎架構具有三大亮點。首先,這個架構很多設計都是可以靈活調控的(Configable),包括對一些參數的配置,一些比較複雜的功能的調控都比較容易,而這樣的靈活調控能力是金融行業的數據處理要求,因爲,這些數據處理的流程長,步驟多,數據變化頻繁,針對一個用戶的數據,需要做多次統計,比如,一個用戶連續性的在某個商店消費的次數,在一個地方停留多少時間,他經常瀏覽的頁面是什麼等等,這些數據的處理,需要基礎架構具有靈活的調控性,以應對隨時都可能變化的數據處理需求。其次,整個基礎架構採用了開放的架構,採用開放架構的優點是,通過社區可以很快的解決一些基礎的問題,從而可以把主要精力用在解決最重要的問題上,同時,開放的架構也更容易促進與其他友商的合作和交流,從而反向促進架構的升級和改進。第三點,是非常重要的一點,YEP共享平臺的基礎架構具有很強的擴展能力,而這個擴展能力一方面體現在擴展用戶的能力,另一方面則體現的是業務擴展的能力,實際上,面對當前不可預知的用戶增長以及變化多端的業務需求,具有靈活擴展性的架構將具有更大的優勢。

企業收益

通過YEP共享平臺,宜人貸在目標客戶獲取和服務能力方面獲得了顯著提升。截至2016年12月31日,宜人貸累計服務了超過50萬借款用戶,近100萬出借用戶,累計促成借款總額達323億人民幣。2016年全年,宜人貸淨收入32.38億人民幣(4.66億美元),較2015年全年增長146%;淨利潤11.16億人民幣(1.61億美元),較2015年全年增長305%。同時,通過平臺數據建模構建用戶畫像、精準匹配、定向推廣,使得運營成本降低50%;根據用戶屬性和行爲設置用戶、價值標籤、用戶分層、針對性營銷,使得轉化率持續提升;通過邏輯回饋+決策樹算法,預警用戶流失,用戶召回率獲得了3倍提升。

在數據抓取方面,通過自然語言解析、知識圖譜匹配、金融數據解析、用戶行爲分析等手段,可以實現毫秒級抓取、秒級解析、實時抓取、流式處理等高效的數據抓取效果,抓取解析成功率高達98%,攔截欺詐賬單達160萬封,分析賬單達3.9億,交易記錄5.4億筆,通話記錄192.2億通。

在反欺詐方面,通過基於Mathematical Modeling和Unsupervised Modeling的雙層賬戶安全體系,賬戶安全性得到了10倍的提升。同時,欺詐案例的發現率相對於人工效率提高了5倍。

據統計,YEP共享平臺從2017年1月投入運營至今,已經對接了20家以上精選的金融科技合作伙伴,累計查詢百萬次以上,峯值QPS在1000以上;識別並證實欺詐用戶千人以上;累積促成交易十億以上;成果顯著!

經驗總結

在談到開發類似YEP共享平臺的經驗時,曹陽表示,對於金融平臺的研發,首先還是要努力去採用一些成熟的最新技術,而對於選擇哪些技術,可以到如CSDN這樣的社區來看哪些技術的關注程度較高。其次,金融平臺的開發人員,需要對數據敏感,需要真正的瞭解業務。第三,金融平臺上的研發是快與慢的結合,慢是指金融系統本身的運作較慢,比如說,對於一個用戶,需要較長的週期才能判斷出他的風險表現。而快是指具體產品研發的速度快。而這個快與慢的結合特別重要,因爲個人信貸變化很快,而且金融類產品比較複雜,關聯的點會比較多,因此開發者需要具有較高的綜合能力。

曹陽最後表示,未來,宜人貸YEP共享平臺將會在獲客能力、數據抓取、反欺詐方面持續增強,此外,還將探討將各種能力單獨輸出的可能性以及數據抓取後數據特徵的提取和分析能力。

據悉,目前宜人貸YEP共享平臺已經向行業開放,種類不同的金融平臺可以進駐,共享宜人貸品牌流量。一方面,能爲客戶提供更豐富的選擇。另一方面,對於非宜人貸目標用戶,YEP共享平臺會在合作企業內爲用戶推薦更爲適合的產品,充分提高用戶的借款效率。通過這種方式,YEP共享平臺將實現更好的客戶體驗,也有助於爲互聯網金融行業整體降低獲客成本、提高服務能力。

歡迎從事金融科技或者對金融科技感興趣的朋友加入CSDN金融科技羣,掃碼進羣,定期優秀文章分享,線下活動參與。

圖片描述