互聯網金融作大數據風控的九種維度

在互聯網金融迅猛發展的背景下,風險控制問題已然成爲行業焦點,基於大數據的風控模型正在成爲互聯網金融領域的熱門戰場。那麼,大數據風控究竟是怎麼一回事呢?與傳統風控相比,它又是怎樣來進行風險識別的呢?本文對此進行了探討。html

 

大數據可以進行數據變現的商業模式目前就是兩個,一個是精準營銷,典型的場景是商品推薦和精準廣告投放,另一個是大數據風控,典型的場景是互聯網金融的大數據風控。安全

 

金融的本質是風險管理,風控是全部金融業務的核心。典型的金融借貸業務例如抵押貸款、消費貸款、P2P、供應鏈金融、以及票據融資都須要數據風控識別欺詐用戶及評估用戶信用等級。工具

傳統金融的風控主要利用了信用屬性強大的金融數據,通常採用20個緯度左右的數據,利用評分來識別客戶的還款能力和還款意願。信用相關程度強的數據緯度爲十個左右,包含年齡、職業、收入、學歷、工做單位、借貸狀況、房產,汽車、單位、還貸記錄等,金融企業參考用戶提交的數據進行打分,最後獲得申請人的信用評分,依據評分來決定是否貸款以及貸款額度。其餘同信用相關的數據還有區域、產品、理財方式、行業、繳款方式、繳款記錄、金額、時間、頻率等。大數據

互聯網金融的大數據風控並非徹底改變傳統風控,實際是豐富傳統風控的數據緯度。互聯網風控中,首先仍是利用信用屬性強的金融數據,判斷借款人的還款能力和還款意願,而後在利用信用屬性較弱的行爲數據進行補充,通常是利用數據的關聯分析來判斷借款人的信用狀況,藉助數據模型來揭示某些行爲特徵和信用風險之間的關係。網站

 

互聯網金融公司利用大數據進行風控時,都是利用多維度數據來識別借款人風險。同信用相關的數據越多地被用於借款人風險評估,借款人的信用風險就被揭示的更充分,信用評分就會更加客觀,接近借款人實際風險。經常使用的互聯網金融大數據風控方式有如下幾種:spa

 

1驗證借款人身份操作系統

驗證借款人身份的五因素認證是姓名、手機號、身份證號、銀行卡號、家庭地址。企業能夠藉助國政通的數據來驗證姓名、身份證號,藉助銀聯數據來驗證銀行卡號和姓名,利用運營商數據來驗證手機號、姓名、身份證號、家庭住址。視頻

 

若是借款人是欺詐用戶,這五個信息均可以買到。這個時候就須要進行人臉識別了,人臉識別等原理是調用國政通/公安局API接口,將申請人實時拍攝的照片/視頻同客戶預留在公安的身份證進行識別,經過人臉識別技術驗證申請人是不是借款人本人。htm

 

其餘的驗證客戶的方式包括讓客戶出示其餘銀行的信用卡及刷卡記錄,或者驗證客戶的學歷證書和身份認證。接口

 

2分析提交的信息來識別欺詐

大部分的貸款申請都從線下移到了線上,特別是在互聯網金融領域,消費貸和學生貸都是以線上申請爲主的

線上申請時,申請人會按照貸款公司的要求填寫多維度信息例如戶籍地址,居住地址,工做單位,單位電話,單位名稱等。若是是欺詐用戶,其填寫的信息每每會出現一些規律,企業可根據異常填寫記錄來識別欺詐。例如填寫不一樣城市居住小區名字相同、填寫的不一樣城市,不一樣單位的電話相同、不一樣單位的地址街道相同、單位名稱相同、甚至居住的樓層和號碼都相同。還有一些填寫假的小區、地址和單位名稱以及電話等。

若是企業發現一些重複的信息和電話號碼,申請人欺詐的可能性就會很高。

3分析客戶線上申請行爲來識別欺詐

欺詐用戶每每事先準備好用戶基本信息,在申請過程當中,快速進行填寫,批量做業,在多家網站進行申請,經過提升申請量來得到更多的貸款。

企業能夠藉助於SDK或JS來採集申請人在各個環節的行爲,計算客戶閱讀條款的時間,填寫信息的時間,申請貸款的時間等,若是這些申請時間大大小於正常

客戶申請時間,例如填寫地址信息小於2秒,閱讀條款少於3秒鐘,申請貸款低於20秒等。用戶申請的時間也很關鍵,通常晚上11點之後申請貸款的申請人,欺詐比例和違約比例較高。

這些異常申請行爲可能揭示申請人具備欺詐傾向,企業能夠結合其餘的信息來判斷客戶是否爲欺詐用戶。

 

4利用黑名單和灰名單識別風險

互聯網金融公司面臨的主要風險爲惡意欺詐,70%左右的信貸損失來源於申請人的惡意欺詐。客戶逾期或者違約貸款中至少有30%左右能夠收回,另外的一些能夠經過催收公司進行催收,M2逾期的回收率在20%左右。

 

市場上有近百家的公司從事我的徵信相關工做,其主要的商業模式是反欺詐識別,灰名單識別,以及客戶徵信評分。反欺詐識別中,重要的一個參考就是黑名單,市場上領先的大數據風控公司擁有將近1000萬左右的黑名單,大部分黑名單是過去十多年積累下來的老賴名單,真正有價值的黑名單在兩百萬左右。

 

黑名單來源於民間借貸、線上P2P、信用卡公司、小額借貸等公司的歷史違約用戶,其中很大一部分再也不有借貸行爲,參考價值有限。另一個主要來源是催收公司,催收的成功率通常小於於30%(M3以上的),會產生不少黑名單。

 

灰名單是逾期可是尚未達到違約的客戶(逾期少於3個月的客戶),灰名單也還意味着多頭借貸,申請人在多個貸款平臺進行借貸。總借款數目遠遠超過其還款能力。

 

黑名單和灰名單是很好的風控方式,可是各個徵信公司所擁有的名單僅僅是市場總量的一部分,不少互聯網金融公司不得不接入多個風控公司,來得到更多的黑名單來提升查得率。央行和上海經信委正在聯合多家互聯網金融公司創建統一的黑名單平臺,可是不少互聯網金融公司都不太願意貢獻自家的黑名單,這些黑名單是用真金白銀換來的教訓。另外若是讓外界知道了自家平臺黑名單的數量,會影響其公司聲譽,下降公司估值,並令投資者質疑其平臺的風控水平。

 

5利用移動設備數據識別欺詐

行爲數據中一個比較特殊的就是移動設備數據反欺詐,公司能夠利用移動設備的位置信息來驗證客戶提交的工做地和生活地是否真實,另外來能夠根據設備安裝的應用活躍來識別多頭借貸風險。

 

欺詐用戶通常會使用模擬器進行貸款申請,移動大數據能夠識別出貸款人是否使用模擬器。欺詐用戶也有一些典型特徵,例如不少設備彙集在一個區域,一塊兒申請貸款。欺詐設備不安裝生活和工具用App,僅僅安裝和貸款有關的App,可能還安裝了一些密碼破譯軟件或者其餘的惡意軟件

欺詐用戶還有可能不停更換SIM卡和手機,利用SI;6利用消費記錄來進行評分;大數據風控除了能夠識別出壞人,還能夠評估貸款人的;按照傳統金融的作法,在家不工做照顧家庭的主婦可能;經常使用的消費記錄由銀行卡消費、電商購物、公共事業費;互聯網金融的主要客戶是屌絲,其電商消費記錄、旅遊;據分析,只要客戶受權其登錄電商網站,其能夠藉助於;7參考社會關係來評估信用狀況;物以類聚,人與羣分。通常狀況下,信用好的人,他的朋友信用也很好。信用很差的人,他的朋友的信用分也很低,

 

欺詐用戶還有可能不停更換SIM卡和手機,利用SIM卡和手機綁定時間和頻次能夠識別出部分欺詐用戶。另外欺詐用戶也會購買一些已經淘汰的手機,其機器上面的操做系統已通過時好久,所安裝的App版本都很舊。這些特徵能夠識別出一些欺詐用戶。

 

6利用消費記錄來進行評分

大數據風控除了能夠識別出壞人,還能夠評估貸款人的還款能力。過去傳統金融依據借款人的收入來判斷其還款能力,可是有些客戶擁有工資之外的收入,例如投資收入、顧問諮詢收入等。另一些客戶可能從父母、伴侶、朋友那裏得到其餘的財政支持,擁有較高的支付能力。

按照傳統金融的作法,在家不工做照顧家庭的主婦可能還款能力較弱。沒法給其提供貸款,可是其丈夫收入很高,家庭平常支出由其太太作主。這種狀況,就須要消費數據來證實其還款能力了。

經常使用的消費記錄由銀行卡消費、電商購物、公共事業費記錄、大宗商品消費等。還能夠參考航空記錄、手機話費、特殊會員消費等方式。例如頭等艙乘坐次數,物業費高低、高爾夫球俱樂部消費,遊艇俱樂部會員費用,奢侈品會員,豪車4S店消費記錄等消費數據能夠做爲其信用評分重要參考。

互聯網金融的主要客戶是屌絲,其電商消費記錄、旅遊消費記錄、以及加油消費記錄均可以做爲評估其信用的依據。有的互聯金融公司專門從事我的電商消費數據分析,只要客戶受權其登錄電商網站,其能夠藉助於工具將客戶歷史消費數據所有抓取並進行彙總和評分。

 

7參考社會關係來評估信用狀況

物以類聚,人與羣分。通常狀況下,信用好的人,他的朋友信用也很好。信用很差的人,他的朋友的信用分也很低,

參考借款人常聯繫的朋友信用評分能夠評價借款人的信用狀況,通常會採用常常打電話的朋友做爲樣本,評估常常聯繫的幾我的(不超過6六我的)的信用評分,去掉一個最高分,去掉一個最低分,取其中的平均值來判斷借款人的信用。這種方式挑戰很大,只是依靠手機號碼來判斷我的信用可信度不高。通常僅僅用於反欺詐識別,利用其常常通話的手機號在黑名單庫裏面進行匹配,若是命中,則此申請人的風險較高,須要進一步進行調查。

 

8參考借款人社會屬性和行爲來評估信用

參考過去互聯網金融風控的經驗發現,擁有伴侶和子女的借款人,其貸款違約率較低;

年齡大的人比年齡低的人貸款違約率要高,其中50歲左右的貸款人違約率最高,

30歲左右的人違約率最低。貸款用於家庭消費和教育的貸款人,其貸款違約率低;

聲明月收入超過3萬的人比聲明月收入低於1萬5千的人貸款違約率高;

貸款次數多的人,其貸款違約率低於第一次貸款的人。 

常常不交公共事業費和物業費的人,其貸款違約率較高。

常常換工做,收入不穩定的人貸款違約率較高。

常常參加社會公益活動的人,成爲各類組織會員的人,其貸款違約率低。

常常更換手機號碼的人貸款違約率比一直使用一個電話號碼的人高不少。

午夜常常上網,很晚發微博,生活不規律,常常在各個城市跑的申請人,其帶貸款違約率比其餘人高30%。

刻意隱瞞本身過去經歷和聯繫方式,填寫簡單信息的人,比信息填寫豐富的人違約機率高20%。

借款時間長的人比借款時間短短人,逾期和違約機率高20%左右。擁有汽車的貸款人比沒有汽車的貸款人,貸款違約率低10%左右。

9利用司法信息評估風險

涉毒涉賭以及涉嫌治安處罰的人,其信用狀況不是太好,特別是涉賭和涉毒人員,這些人是高風險人羣,一旦得到貸款,其貸款用途不可控,貸款有可能不會獲得償還。

尋找這些涉毒涉賭的嫌疑人,能夠利用當地的公安數據,可是難度較大。也能夠採用移動設備的位置信息來進行必定程度的識別。若是設備常常在半夜出如今賭博場所或賭博區域例如澳門,其申請人涉賭的風險就較高。另外中國有些特定的地區,當地的有一部分人羣從事涉賭或涉賭行業,一旦申請人填寫的居住地址或者移動設備位置信息涉及這些區域,也要引發重視涉賭和涉毒的人員工做通常也不太穩定或者沒有固定工做收入,若是申請人常常換工做或者常常在某一個階段沒有收入,這種狀況須要引發重視。涉賭和涉毒的人活動規律比較特殊,常常半夜在外面活動,另外也常常住本地賓館,這些信息均可以參考移動大數據進行識別。 

總之,互聯網金融的大數據風控採用了用戶社會行爲和社會屬性數據,在必定程度上補充了傳統風控數據維度不足的缺點,可以更加全面識別出欺詐客戶,評價客戶的風險水平。互聯網金融企業經過分析申請人的社會行爲數據來控制信用風險,將資金借給合格貸款人,保證資金的安全。

轉自:http://www.360doc.com/content/16/0608/11/8507568_566017106.shtml

相關文章
相關標籤/搜索