【說在前面】本人博客新手一枚,象牙塔的老白,職業場的小白。如下內容僅爲我的看法,歡迎批評指正,不喜勿噴![握手][握手]
【再囉嗦一下】若是你對數據挖掘感興趣,歡迎先瀏覽個人另外一篇隨筆:數據挖掘比賽/項目全流程介紹
【再囉嗦一下】若是你對金融科技感興趣,歡迎瀏覽個人另外一篇隨筆:若是你想了解金融科技,不妨先了解金融科技有哪些可能?
【最後再說一下】本文結合了博主、內部賽優秀團隊以及外部賽冠/亞/季軍的方案分享!html
如何進行金融行業數據分析與建模,是挖掘金融行業數據價值的重要手段。金融行業數據分析與建模方法主要包括七個重要環節,每一個環節緊密相連。
python
貸款風險預測(逾期還款分三種狀況:要麼用戶不肯意還款、要麼沒有錢還款、要麼忘了還款)面試
根據數據集中8萬用戶的相關信息,預測用戶將來是否會逾期還款。算法
用戶基本信息、銀行卡流水、信用卡帳單信息以及用戶行爲數據,字段內容均爲脫敏數據。機器學習
Kolmogorov-Smirnov(KS)是風險評分領域經常使用的評估指標,反應模型對正負樣本的辨識能力,KS越高代表模型對正負樣本的辨識能力越強。
KS = max { | f(s|P) - f(s|N) | }
其中,f(s|P) 爲正樣本預測值的累計分佈函數,f(s|N) 爲負樣本在預測值上的累計分佈函數。
函數
經過數據可視化查看數據樣本的分佈以及特徵的統計規律。學習
主要包括數據的缺失值處理、異常值處理、拼接、去重等基本處理。同時,還有匯率轉換和單位淨值*份額等基本數據操做。測試
根據類別型和數值型數據在標籤上的分佈進行預處理,包括標準化、歸一化、離散化、平滑化、one-hot編碼等。優化
若是你對金融科技感興趣,歡迎瀏覽個人另外一篇博客:若是你想了解金融科技,不妨先了解金融科技有哪些可能?
若是您對數據挖掘感興趣,歡迎瀏覽個人另外一篇博客:數據挖掘比賽/項目全流程介紹
若是你對智能推薦感興趣,歡迎先瀏覽個人另外一篇隨筆:智能推薦算法演變及學習筆記
若是您對人工智能算法感興趣,歡迎瀏覽個人另外一篇博客:人工智能新手入門學習路線和學習資源合集(含AI綜述/python/機器學習/深度學習/tensorflow)
若是你是計算機專業的應屆畢業生,歡迎瀏覽個人另一篇博客:若是你是一個計算機領域的應屆生,你如何準備求職面試?
若是你是計算機專業的本科生,歡迎瀏覽個人另一篇博客:若是你是一個計算機領域的本科生,你能夠選擇學習什麼?
若是你是計算機專業的研究生,歡迎瀏覽個人另一篇博客:若是你是一個計算機領域的研究生,你能夠選擇學習什麼?
以後博主將持續分享各大算法的學習思路和學習筆記:hello world: 個人博客寫做思路編碼