做者:個推高級數據工程師 曉駿算法
衆所周知,金融是數據化程度最高的行業之一,也是人工智能和大數據技術重要的應用領域。隨着大數據收集、存儲、分析和模型技術日益成熟,大數據技術逐漸應用到金融風控的各個環節。個推做爲專業的數據智能服務商,擁有海量數據資源,在智慧金融領域也推出了相應的數據解決方案-個真,爲金融客戶提供智能反欺詐、多維信貸風險評估和高意願用戶智能篩選等全流程的數據服務,助力各金融機構全面提高風控能力。本文將圍繞大數據風控,結合個推實踐,介紹金融風控機器學習的基本流程、算法實踐和產品化建設等內容。機器學習
風控流程 & 多維度特徵學習
大數據風控的內容大數據
數據是風控的核心要素,大數據風控實際上就是對數據的處理、建模和應用的過程。大數據風控的流程主要分爲四個階段:數據獲取、數據分析、數據建模、風控產品應用。對獲取到的海量數據進行清洗和挖掘,有針對性地對金融特徵進行深加工;接着經過規則策略和模型算法的構建,對外輸出相應的風控服務。人工智能
個推以消息推送服務起家,爲數十萬APP提供高效穩定的推送服務,並沉澱了豐富的數據資源,覆蓋超過40億終端設備,數據全面、普遍且有深度。利用設備基礎信息、線上APP偏好數據、線下場景數據以及外部補充數據,個推構建了8個維度、350+特徵,同時對特徵進行動態更新。基本屬性、資產、金融、行爲偏好、社會屬性、消費偏好、風險和穩定性構成了個推金融數據的八大維度;個推利用數據的八大維度,逾350種特徵進行模型構建,並將其應用於金融風控各環節。設計
金融風控機器學習的基本流程3d
整個風控建模流程,在個推大數據平臺上完成。首先,對持續更新的海量一手數據進行收集、清洗、存儲,在數據存儲前進行ID打通;第二步,對清洗好的原數據進行特徵構建;最後,利用多維度特徵進行金融風控模型構建,用到的技術包括協同推薦算法、LR算法、XGBoost、營銷模型、多頭模型和信用分模型等。blog
建模流程排序
如何高效構建特徵,是風控建模中一個相當重要的問題。在實踐中,個推會對特徵進行穩定性分析、髒數據/異常數據處理、特徵分箱、特徵聚合和特徵有效性驗證。特徵評估指標則包括IV值、Gain值、單調性、穩定性和飽和度等。圖片
風控場景機器學習的算法實踐
利用上述多維度特徵和建模能力,增能於貸前、貸中和貸後全流程:拉、選、評、管、催五大環節。
全流程數據增能
拉-營銷模型,甄別虛假註冊,評估借貸意願
在拉新獲客階段,個推制定貼合大額、小額兩種營銷場景需求的營銷模型,經過規則策略、模型策略、風控策略三管齊下,幫助客戶識別「真人」,有效下降獲客成本、提高註冊率和轉化率。客戶可經過提供樣本數據,經過個推來完成建模,同時,在缺少樣本數據的狀況下,個推依託自身積累的海量樣本數據,能夠構建出多種營銷場景下的通用模型,供客戶使用。
選-貸前的審覈,識別欺詐人羣,防範惡意騙貸
貸前審覈階段咱們一般採起兩個策略:欺詐分模型、風險人羣篩選。欺詐分模型指的是根據客戶提供的數據信息在個推平臺進行數據轉換、特徵匹配,並對其風險特徵予以篩選,利用預設規則予以打分,最後得出相應的欺詐分。個推在逾350種特徵中識別出數幾十種風險特徵。舉例來講,當某用戶安裝小貸類APP達到多款以上,或線下到訪場景異常,或該用戶命中黑名單都會被識別爲風險特徵。根據欺詐分的高低予以排序,爲客戶列出不許入人員、需重點關注人員等。
風險人羣篩選指的是根據用戶存在的風險特徵數量及程度,梳理出風險人員。個推利用篩選出的8種維度、350+特徵,經過模型預測和規則制定,輸出三類風險人羣:黑名單、灰名單、多頭名單。多頭名單顧名思義,當某用戶頻繁安裝或卸載多款借貸類APP時則會被模型系統斷定爲多頭人員;灰名單指的是穩定性較差的人員,黑名單指的是異常人員。在貸前審覈階段,黑名單人員可直接不予以准入,灰名單和多頭人員則須要重點關注。
評-信用分模型,貸前信用評估,輔助貸款定額
在評的階段,個推採用信用分模型,爲客戶輸出用戶的信用評分。信用評分由五種維度構建而成:資產、身份、穩定性、關係、行爲。個推信用評分模型先根據模型訓練與規則模型,獲得各個維度分,再將五個維度的我的評分做爲特徵輸入模型,做爲特徵獲得整體我的信用分。
信用分模型由多個模型整合而成,第一層是分類模型(lr+xgboost),獲得分值;第二層在維度分的基礎上再進行迴歸,獲得最終信用評分。
管-貸中管控,監測異常特徵,實現風險預警
在管的環節,個推採用貸中監測模型。從總體人羣篩選出逾期類似(相關)人羣,結合實時數據與高危特徵異常監測獲得高疑用戶,結合客戶的實際需求,對此類用戶經過進一步的精準研判獲得逾期風險人員,將此類人員告知客戶,讓其予以重點關注或排查。
催-貸後催管,催回價值評估,提升催回效率
在催的環節,個推基於自身構建的催回評分系統,能夠有效指導金融機構制定差別化催管策略,助力更高效地完成催收工做。好比,當客戶出現逾期和壞帳時,金融機構經過個推的催回評分,對用戶的還款能力和還款意願進行評估,從而判斷哪些用戶優先催。
風控系統產品化
前面幾個流程主要講的是個推利用多維度特徵自主構建風控模型,但在不少業務場景客戶但願快速構建特徵、快速返回風控結果。爲此,咱們研發上線個真決策引擎,在規則設計層爲客戶提供風控規則,讓業務人員在規則執行層經過規則性加工進行靈活操做,目前已提供給部分客戶試用。
風控決策引擎
現在,科技與金融深度交融的時代已經到來,金融風險控制任重而道遠,。個推將持續挖掘其豐富的數據資產,不斷打磨自身技術,助力金融行業運做效率和服務能力的全面提高。
(本文全部圖片均來源於個推)
更多技術乾貨,請關注公衆號:個推技術學院。