現在在銀行,P2P等各類貸款業務機構,廣泛使用信用評分,對客戶實行打分制,以期對客戶有一個優質與否的評判。可是不是全部人都知道信用評分卡還分A,B,C卡三類!因此,若是你只知道ABC是Gary的ABC湯,那就趕忙來補習下這些知識吧~~ html
A卡(Application score card)申請評分卡
B卡(Behavior score card)行爲評分卡
C卡(Collection score card)催收評分卡
三種卡的介紹,請直接看這篇文章:比較全面的說了三種打分機制。
梁世棟博士的《行爲評分和貸後風險管理研究》http://www.docin.com/p-516772778.html
這三種打分機制的區別在於:
1.使用的時間不一樣。分別側重
貸前、貸中、貸後;
2.數據要求不一樣。
A卡通常可作貸款0-1年的信用分析,B卡則是在申請人有了必定行爲後,有了較大數據進行的分析,通常爲3-5年,C卡則對數據要求更大,需加入催收後客戶反應等屬性數據。
3.每種評分卡的模型會不同。在A卡中經常使用的有
邏輯迴歸,
AHP[層次分析法(Analytic Hierarchy Process,簡稱AHP)]等,而在後面兩種卡中,常使用
多因素邏輯迴歸,精度等方面更好。
3.檢測評分卡中客戶羣的
特徵變化,已經這些變化對評分卡分值的衝擊。
2.計算
某些特定參數,用以觸發某些行動,好比重建評分卡、重設臨界值或調整評分卡刻度;
1.判斷評分卡的
實際表現,並與開發階段的
預期對比;
檢測與報告:
拒絕演繹:評分卡開發使用的是審批經過且運行一段時間的帳戶數據,已經表現出正常或違約的帳戶狀態。拒絕演繹是嘗試去分析可能會違約並在評分卡開發前已經被拒絕的帳戶。
9.評分卡的實施:不一樣業務部門使用評分卡前,須要將評分卡轉換爲可實施代碼,肯定最終得分的臨界值,以對應所需的業務行動。
8.評分卡建立和刻度:logistics迴歸模型創建並經過檢驗後,轉換爲標準評分卡的形式
4.必須
有意義,在業務變量和預測值方面是
可解釋的。
3.必須
簡單;
2.必須
穩健,能接受更廣範圍的數據集;
1.必須達到
可接受的準確性水平;
7.模型驗證:
6.模型開發:基於
logistics迴歸模型
5.變量選擇:只選擇表現出
較強預測力的變量,減小變量的數量
(關於數據準備的內容參考Refaat M.(2006)《Data Preparation for Data Mining Using SAS》
4.評分卡中全部變量都要進行證據
權重(WOE)轉換,對變量轉換前,須要減小分類變量的基數,須要將連續變量分段。
3.須要進行大量的數據清洗和轉換工做;
2.建立包含開發評分卡模型所需的全部要素的惟一數據集;
1.
耗時長,最重要;
4.數據準備:
3.經過列聯表、關聯性和相關性指標肯定不一樣變量之間的檢驗關係。
2.要素分析:計算每一個候選預測變量分類或分段條件下的違約率分佈;
1.候選預測變量的單變量統計特徵評價,取值在變量範圍內的分佈;
3.EDA與數據描述(主要是檢查數據並理解其特徵):
2.對於外部數據的使用,注意合理選擇外部數據供應商。
1.對於內部數據的使用,注意帳戶和客戶的區別,多個客戶會使用一個聯名帳戶joint accounts;
2.數據獲取和整合:
4.設計項目管理計劃,對時間、資源、人員進行管理。
3.識別數據的範圍和來源,內部仍是外部,確保能獲得數據;
2.肯定計劃評分卡的範圍,開發和實施窗口;
1.在具體業務或信貸歷史的認識基礎上,肯定違約和正常的定義;
1.問題準備:
評分卡的開發流程:
5.對各個變量的不一樣取值範圍賦予必定分數,使消費者清楚如何提升信用分。
4.各項變量的簡單加法容易在各平臺中實現;
3.比率odds ratio的使用;
2.每項加總獲得信用分數使信用分數更透明;
1.易於理解;
標準評分卡的優點:
3.若得分在二者之間,則該帳戶須要人工干預(要求提供額外信息如工資證實等)。
2.若得分大於Sh,則該帳戶爲正常;
1.若得分小於Sl,則該帳戶爲違約;
關於帳戶的不肯定值:
狀態變量中:1表示違約,0表示正常
正常和違約的標準取決於逾期,通常設置60天、90天或180天的口徑。
4.審查貸款訂價和貸款條件。
3.制定清收策略(若違約);
2.審查信用額度;
1.審查信用重建;
2.行爲評分卡的評分結果更精確,由於基於更多交易數據:
4.貸款訂價(利率水平)。
3.貸款額/信用額度;
2.抵押物;
1.估計的信用情況;
1.申請評分卡的評分結果將決定:
評分卡分兩類:申請評分卡(批准前)和行爲評分卡(批准後):
打分卡技術的核心原理是使用一組變量,經過變量取值獲得一個客戶信用評分,該評分後面對應的其實是好壞比,好比國際有名的FICO評分680分對應的好壞比是144:1。對銀行來講,掌握了好壞比率,就明確了將來的盈利狀況。舉例來講,假定銀行當前客戶羣的好壞比率是20/1,即21我的中20個是好的,一個是壞的。對這我的羣發放貸款,必須經過20我的的收入來抵消1個壞客戶的支出(假定壞帳戶本金所有損失),以最後利潤率3%計算,通過計算,能夠獲得最低放貸利率爲8.15%,即對這我的羣必須用8.15%的利率才能獲得指望的理論收益;一樣的方法能夠算出,對好壞比率80/1的客戶羣,其利率是4.2875%。打分會有誤差,比如價值和價格出現誤差同樣。網絡
3.打分卡使用
打分卡使用場合不少,包括營銷評分、申請評分、行爲評分、回款催收評分等等,按照具體的產品還能夠分爲信用卡、車貸、房貸、經營性貸款評分等等,還有按照不一樣地域的評分等等。根據不一樣的業務戰略,打分卡的各項參數要作設定,打分卡的使用比打分卡開發更重要。
4.打分卡開發
打分卡開發方法,包括邏輯迴歸、神經網絡、決策樹、馬爾科夫鏈、生存分析等等,用的最多的,仍是傳統的邏輯迴歸,採用邏輯迴歸的打分卡開發基本流程大體爲選取樣本、定義好壞標準、尋找可用變量、選擇變量、評分模型開發、設置取捨點(cutoff)六個過程,其主要工做量在前面幾部。打分卡模型通常包含15個左右變量,這是因爲變量之間通常都會有耦合(耦合是指兩個或兩個以上的電路元件或電網絡等的輸入與輸出之間存在緊密配合與相互影響,並經過相互做用從一側向另外一側傳輸能量的現象.耦合效應(Coupling Induction),也稱互動效應,聯動效應),好比職務和職稱,職務高的人通常職稱也高,但不該該重複計算。若是變量太多,去掉變量間耦合會比較困難,也會使模型不穩定,某個變量的小小變化可能致使分值變化很大。
運用信用評分卡須要注意的問題
一、開展信用卡業務的歷史要長。
評分卡的發展必須以歷史數據爲依據,若是銀行剛開始發行信用卡,尚未歷史數據,或雖然已經發卡,但歷史過短,數據不充分,則不具有開發評分卡的條件。
二、發展信用評分卡須要大量的數據,並且數據的質量要好。(數量+質量)
若是數據不多,不具備表明性或數據質量不好,有不少錯誤,那麼基於該數據的評分卡就不會準確,那麼申請評分卡的發展就會受到制約。
三、數據的保存要完整
銀行必須把歷史上各個時期申請該信用卡的客戶申請表信息、當時的信用報告記錄、開戶的信用卡帳戶表現好壞等數據保存起來,不只全部被批准的客戶的數據要保存,被拒絕的申請者數據也應該保存,以進行模型的表現推測。並且,保存的數據不只要足以提煉出各類預測變量,還要可以辨別其表現(好、壞等)。
四、申信用評分卡只是提供了決策依據,不是決策自己。
信用評分卡並不能告訴審批人員某個客戶必定是好的或壞的,它只是告訴咱們必定的機率,所以,對於有些客戶的申請審批決定就必須綜合信用報告等其它信息做出判斷。
五、一張申請評分卡很難知足整我的羣,須要針對不一樣人羣創建單獨的評分卡。(千人千面,分層)
因爲我行客戶分佈在全國各地,存在着較大的地域差異,各地區經濟發展也存在着較大差異,客戶消費習慣有較大差別,若是使用一張申請評分卡就會形成信用評分的不真實。
六、時間越久,信用評分卡的有效性會下降,由於經濟環境、市場情況和申請者、持卡者的構成在不斷變化,使得樣本人羣的特質和屬性發生改變,特別是在經濟高速發展的階段,人羣的生活方式、消費習慣、經濟情況等變化很快,申請評分模型在應用一段時間後一般會與初期模型產生偏移,因此須要適當從新調整,必要時還要從新開發,以保證信用評分卡的有效性。大數據