一提到hadoop相信熟悉IT領域或者常常關注互聯網新聞的朋友都應該很熟悉了,固然,這種熟悉可能也只是聽着名字耳熟,但並不知道它具體是什麼東西,或者用來作什麼。這些都不重要,重要的是你知道有hadoop這麼個東西就能夠了。網絡
前段時間碼了一些hadoop方面的分享文章,純屬我的的一點小經驗,可能有的地方寫的很差,將就下吧!今天要分享的這篇是轉載的一篇大快搜索公衆號上的文章,是關於時下比較熱鬧的P2P金融方面對hadoop應用的一個架構設計。架構
如下爲原文:框架
P2P網絡貸款(「peer-to-peer」)爲中小企業和我的提供了便利的融資渠道。近年來,隨着互聯網金融的逐步發展,P2P網貸已成爲時下煊赫一時的互聯網金融新模式。憑藉着「高收益」的理財優點,各種P2P網貸平臺呈現逐年增加的態勢。目前,我國正常運行P2P平臺數量已達近3000家,累計成交量約8000億元。oop
然而,網貸業在爆發式增加的同時,也存在着重大風險。高利率龐氏騙局、投放假標的、平臺自融、洗錢、資金挪用、虛報理財業績、跑路等形形色色的平臺問題不斷髮生。大平臺逾期還款,小平臺跑路的新聞家常便飯,給投資人形成巨大損失,形成信任危機。使投資者損失慘重。目前P2P網貸面臨的最大風險是信用風險,信用風險已經成爲P2P網貸行業發展的主要瓶頸,而借款人信用評估則是下降信用風險、提升企業風險管理水平的決定性因素。大數據
國內外關於P2P網貸借款人信用評估方面的相關研究主要是從評估指標和評估方法兩個方面進行探討的。因爲國外具備比較完備的數據共享徵信系統,因此國外對於借款人信用評估的研究不只包括平臺自己的借款人信息,還包括政府信用系統、社交網絡、購物行爲等其餘平臺共享信息;而國內關於P2P網貸的研究大都只是介紹了目前主要P2P網貸平臺的運營模式,或者僅針對特定平臺進行風險研究,評估指標的採用沒有一個統一的標準。 架構設計
所以,雖然目前應用於借款人信用風險評估的指標多達幾十種,可是除了少數針對借款人我的信息的指標相同外,不一樣P2P網貸平臺採用的其餘指標都不盡相同,在研究信用風險問題時,因爲採用的指標不一樣,給出的結論也不盡相同,很難給出指標與風險之間明確的做用關係,而關於對借款人進行信用風險評估,須要哪些基本指標做爲評估標準,才能說明評估的全面性、通用性、可信性的研究鮮有報道。設計
另外一方面,隨着數據量和數據種類的不斷增長,P2P網貸平臺的數據量已達到了PB、EB甚至 EB級別,而隨着銀行信用系統、其餘共享系統等平臺數據的不斷接入,應用大數據技術進行平臺數據管理和分析已經是必然。目前絕大多數借款人信用風險評估研究都是基於靜態分析給出的結果,然而數據是變化的,風險在變化中產生,從動態角度,對借款人信用風險進行實時分析、跟蹤監測更具實際意義。blog
基於上述緣由,本研究應用大數據技術,創建借款人信用風險實時監測模型和風控方案,爲P2P網貸平臺借款人信用風險評估提供大數據架構參考。hadoop
研究內容的總體框架如圖1所示:互聯網
圖1 研究總體框架
大數據實時監測模型架構如圖2所示:
圖2 大數據實時監測模型框架
研究技術路線如圖3所示:
圖3 研究技術路線