https://blog.csdn.net/varyall/article/details/81173326算法
現在在銀行、消費金融公司等各類貸款業務機構,廣泛使用信用評分,對客戶實行打分制,以期對客戶有一個優質與否的評判。可是不是全部人都知道信用評分卡還分A,B,C卡三類!數據庫
A卡(Application score card)申請評分卡大數據
B卡(Behavior score card)行爲評分卡.net
C卡(Collection score card)催收評分卡設計
評分機制的區別在於:blog
1.使用的時間不一樣。分別側重貸前、貸中、貸後;開發
2.數據要求不一樣。A卡通常可作貸款0-1年的信用分析,B卡則是在申請人有了必定行爲後,有了較大數據進行的分析,通常爲3-5年,C卡則對數據要求更大,需加入催收後客戶反應等屬性數據。get
3.每種評分卡的模型會不同。在A卡中經常使用的有邏輯迴歸,AHP等,而在後面兩種卡中,常使用多因素邏輯迴歸,精度等方面更好。數據分析
信用評分是指根據銀行客戶的各類歷史信用資料,利用必定的信用評分模型,獲得不一樣等級的信用分數,根據客戶的信用分數,授信者能夠經過分析客戶按時還款的可能性,據此決定是否給予授信以及授信的額度和利率。產品
雖然授信者經過人工分析客戶的歷史信用資料,一樣能夠獲得這樣的分析結果,但利用信用評分卻更加快速、更加客觀、更具備一致性。
1、引進信用評分卡的目的及意義
一、因爲零售信貸業務具備筆數多、單筆金額小、數據豐富的特徵,決定了須要對其進行智能化、機率化的管理模式。信用評分模型運用現代的數理統計模型技術,經過對借款人信用歷史記錄和業務活動記錄的深度數據挖掘、分析和提煉,發現蘊藏在紛繁複雜數據中、反映消費者風險特徵和預期信貸表現的知識和規律,並經過評分的方式總結出來,做爲管理決策的科學依據。
二、目前國內大多數銀行信用卡部門採起人工審批做業形式,審批依據是審批政策、客戶提供的資料及審批人員的我的經驗進行審批判斷,存在如下問題:
(1)信審人員對申請人所提交申請資料真實性的認定基本依賴於受理申請資料的信貸業務員的職業操守和業務素質,審批人員對申請人資料的核實手段基本依賴於電話覈查,對申請覈准與否基本依賴於本身的信審業務經驗,授信審查成本高、效率低而又面臨很大的欺詐風險,這種情況很難應對年底所謂的「行業旺季」中大規模集中的小額貸款業務須要。
(2)審批決策容易受主觀因素影響、審批結果不一致,審批政策調控能力相對薄弱。
(3)不利於量化風險級別,沒法進行風險分級管理,影響風險控制的能力及靈活度,難以在風險與市場之間尋求合適的平衡點。
(4)審批效率還有較大提高空間。
三、信用評分卡具備客觀性,它是根據從大量數據中提煉出來的預測信息和行爲模式制定的,反映了借款人信用表現的廣泛性規律,在實施過程當中不會因審批人員的主觀感覺、我的偏見、我的好惡和情緒等改變,減小了審批員過去單憑人工經驗進行審批的隨意性和不合理性。
四、信用評分卡具備一致性,在實施過程當中先後一致,不管是哪一個審批員,只要用同一個評分卡,其評估和決策的標準都是同樣的。
五、信用評分卡具備準確性,它是依據大數原理、運用統計技術科學地發展出來的,預測了客戶各方面表現的機率,使銀行能比較準確地衡量風險、收益等各方面的交換關係,找出適合本身的風險和收益的最佳平衡點。
六、運用信用評分卡能夠極大地提升審批效率。因爲信用評分卡是在申請處理系統中自動實施,只要輸入相關信息,就能夠在幾秒中內自動評估新客戶的信用風險程度,給出推薦意見,幫助審批部門更好地管理申請表的批覈工做,對於業務批量巨大、單筆業務金額較小的產品特別適合。
2、信用評分模型的簡介
信用評分模型的類型較多,比較常使用的3個以下:
(1)在客戶獲取期,創建信用局風險評分,預測客戶帶來違約風險的機率大小;
(2)在客戶申請處理期,創建申請風險評分模型,預測客戶開戶後必定時期內違約拖欠的風險機率,有效排除了信用不良客戶和非目標客戶的申請;
(3)在賬戶管理期,創建催收評分模型,對逾期賬戶預測催收策略反應的機率,從而採起相應的催收措施。
3、信用評分卡的開發
信用評分模型開發流程包括模型的設計與規劃、樣本的選擇、預測變量的選擇和肯定、模型的制定、模型效果的評估和檢驗、模型的實施、模型表現的跟蹤和監控等。
(1)創建開發目標、方法及業務問題的定義
開發目標:
一、確保決策的一致性,減小人工干預,提升信貸政策的執行力;
二、準確反映並量化客戶的風險級別,用科學的方法管理風險以控制和減小信貸損失;
三、提升市場競爭能力,在控制可接受的風險水平的同時爭取更多優質客戶,有效地提升市場佔有率;
四、實現審批流程自動化,減小運營成本。
模型創建方法:創建模型可採用的方法不少,業內一般使用邏輯迴歸方法創建貸款申請評分模型。
好、壞客戶定義:好、壞客戶的定義必須與銀行整體政策、管理目標一致,綜合考慮風控策略、催收策略、業務歷史、樣本數量的須要,如定義曾經有90天以上逾期不良記錄的客戶爲壞客戶;定義滿12個月,未出現90天以上逾期記錄的客戶爲好客戶。
(2)肯定數據源,選取樣本
數據來源:內部信用卡核心系統數據庫和其它相關業務系統;
樣本總數量:選取某地區從2014年1月開始2016年6月的全部申請人,總數120,000人(包括好、壞客戶及拒絕的申請客戶);
樣本空間:
一、壞客戶樣本空間:2014年8月至2016年2月之間開戶的客戶;
二、好客戶樣本空間:2014年6月至2015年5月之間開戶的客戶;
三、被拒絕客戶樣本空間:2015年7月至2016年6月之間申請被拒絕的客戶。
(3)數據抽取、清理和整理,創建數據集
這一步是開發申請評分模型中最重要、最耗時的步驟之一。數據質量好壞是決定開發的模型成功的關鍵因素。在肯定數據來源後,因爲須要採集的數據資料來源不一,數據量大,抽取時耗時較多,就須要在原始數據的基礎上,根據業務需求、數據性質、結構及內在邏輯,對數據進行歸類、合併、分組,最終創建數據集(或數據倉庫)。
(4)數據分析、變量選擇及轉換
數據通過整理後下一步進行數據資料的分析,找出其內在關聯性,並通過對樣本變量的分組、合併和轉換,選擇符合建模條件、具備較強預測能力的變量。
若是是連續變量,就是要尋找合適的切割點把變量分爲幾個區間段以使其具備最強的預測能力。例如客戶年齡就是連續變量,在這一步就是要研究分紅幾組、每組切割點在哪裏預測能力是最強的。這一步是評分模型很是重要也是最耗費時間的步驟。若是是離散變量,每一個變量值都有必定的預測能力,可是考慮到可能幾個變量值有相近的預測能力,所以分組就是不可避免並且十分必要的。
經過對變量的分割、分組和合並轉換,最終剔除掉預測能力較弱的變量,篩選出符合小額貸款實際業務需求、具備較強預測能力的變量,使創建的模型更加有效。
(5)建立評分模型
利用上面分組後造成的最新數據集進行邏輯迴歸運算獲得初始迴歸模型。在迴歸模型的基礎上,經過幾率與分數之間的轉換算法把機率轉換成分數進而獲得初始評分卡。下一步要將初始評分卡通過拒絕推論,所謂拒絕推論,即申請被拒絕的客戶數據未歸入評分系統,致使樣本選取的非隨機性,總體信用狀況所以被扭曲,信用評分模型的有效性下降。
由於申請風險評分模型是用來評估將來全部借款申請人的信用,其樣本必須表明全部的借款申請羣體,而不只表明信用質量較好、被批准的那部分客戶的信用情況,因此樣本必須包括歷史上申請被拒絕的申請人,不然,樣本空間自己就會出現系統性誤差。由於樣本排除了較高信用風險的申請人羣體(即歷史上申請被拒絕的客戶)。若是僅僅依靠被批准申請人羣體的樣本開發評分模型,並將其運用到整個申請人羣體中去,而被批准和被拒絕羣體的行爲特徵和「壞」的比例每每截然不同,那麼這種以被批准羣體表明被拒絕羣體的作法將必然在很大程度上弱化模型的預測精度。
進行拒絕推論時,因爲這部分被拒絕申請人的好壞表現是不可知的,必須以必定的統計手段來推測。推測的方法有不少,能夠利用初始評分卡對這部分被拒絕客戶進行評分,從而得出每一個被拒絕客戶若是被審批成爲好客戶的機率和壞客戶的機率,再按其權重放入模型樣本中,這樣會盡可能減小樣本的誤差,同時兼顧拒絕樣本的不肯定性。咱們利用拒絕推論後造成的樣本(包括覈准和拒絕的)從新對每一個變量進行分組,其原理和方法與初始分組相同。而後對第二次分組造成的數據集創建邏輯迴歸模型。最後在第二次迴歸模型的基礎上,經過幾率與分數之間的轉換算法把機率轉換成分數,進而獲得最終評分卡。
(6)模型檢驗
模型創建後,須要對模型的預測能力、穩定性進行檢驗後才能運用到實際業務中去。申請評分模型的檢驗方法和標準一般有:交換曲線、K-S指標、Gini數、AR值等。通常來講,若是模型的K-S值達到30%,則該模型是有效的,超過30%以上則模型區分度越高,本例中模型的K-S值達到40%以上,已經能夠上線使用。
(7)創建MIS報表,模型的實施、監控及調整
模型實施後,要創建多種報表對模型的有效性、穩定性進行監測,如:穩定性監控報表,比較新申請客戶與開發樣本客戶的分值分佈,監控模型有效性;特徵分析報表,比較當前和開發期間的每一個記分卡特徵的分佈,監控模型有效性;不良貸款分析報表,評估不一樣分數段的不良貸款,而且與開發時的預測進行比較,監控客戶信貸質量;最後分值分析報表,分析不一樣分數段的申請人、批准/拒絕以及分數調整的客戶分佈,監控政策執行狀況等。
另外,隨着時間的推移,申請評分卡的預測力會減弱,由於經濟環境、市場情況和申請者、持卡者的構成在不斷變化,同時,銀行總體策略和信貸政策的變化也要求評分模型適時調整,因此,申請評分卡在創建後須要持續監控,在應用一段時間(通常2-3年)之後必須適當從新調整或重建。
4、運用信用評分卡須要注意的問題
一、開展貸款業務的歷史要長。
評分卡的發展必須以歷史數據爲依據,若是公司開展小貸業務的歷史過短,數據不充分,則不具有開發評分卡的條件。
二、發展信用評分卡須要大量的數據,並且數據的質量要好。
若是數據不多,不具備表明性或數據質量不好,有不少錯誤,那麼基於該數據的評分卡就不會準確,那麼申請評分卡的發展就會受到制約。
三、數據的保存要完整
小貸公司必須把歷史上各個時期申請貸款的客戶申請表信息、當時的信用報告記錄等數據保存起來,不只全部被批准的客戶的數據要保存,被拒絕的申請者數據也應該保存,以進行模型的表現推測。並且,保存的數據不只要足以提煉出各類預測變量,還要可以辨別其表現(好、壞等)。
四、信用評分卡只是提供了決策依據,不是決策自己。
信用評分卡並不能告訴審批人員某個客戶必定是好的或壞的,它只是告訴咱們必定的機率,所以,對於有些客戶的申請審批決定就必須綜合信用報告等其它信息做出判斷。
五、一張申請評分卡很難知足整我的羣,須要針對不一樣人羣創建單獨的評分卡。
因爲愛投在外地其餘省份還有好幾家分公司,存在着較大的地域差異,各地區經濟發展也存在着較大差異,客戶消費習慣有較大差別,若是使用一張申請評分卡就會形成信用評分的不真實。
六、時間越久,信用評分卡的有效性會下降,由於經濟環境、市場情況和申請者、借款人的構成、業務的來源渠道在不斷變化,使得樣本人羣的特質和屬性發生改變,特別是在經濟高速發展的階段(或是股市大牛市階段),人羣的生活方式、消費習慣、經濟情況等變化很快,申請評分模型在應用一段時間後一般會與初期模型產生偏移,因此須要適當從新調整,必要時還要從新開發,以保證信用評分卡的有效性。