近期,CCTV9播放了自制的系列紀錄片《大數據時代》,該片是國內首部大數據產業題材紀錄片,節目細緻而生動地講述了大數據技術在政府治理、民生服務、數據安全、工業轉型、將來生活等方面給咱們帶來的改變和影響。在第四集中,講述了芝麻信用如何助力共享經濟,推進商業信用體系建設的故事。咱們將其摘錄分享出來,並簡要介紹芝麻信用背後的技術。算法
曹雪瑩是一名平面模特,工做性質讓她常常穿着不一樣的服裝,在不一樣的場合,須要穿不一樣的衣服,而且風格還不能重樣,服裝開銷佔了曹雪瑩平常開支的很大一部分。不少女人,總會感受本身的衣櫥裏少一件衣服,曹雪瑩更是如此。安全
一個偶然的機會,曹雪瑩發現了一種共享衣櫥的消費模式,每個月花銷不到500元,即可換穿30件衣服,其中有很多,是高於曹雪瑩消費水平的輕奢品牌,而且大部分衣服都是免押金。一年下來,曹雪瑩能夠節省不少買衣服的錢,這一切得益於信用體系。網絡
芝麻信用技術總監毛仁歆,即是這個信用評價體系的搭建者之一。他一直在用算法和模型創新商業模式,信用評估,即是毛仁歆團隊利用算法創造的一個非金融的商業信用評價體系。框架
「咱們其實在技術領域有很是很是多的創新,經過這樣的一個信用評價體系,咱們將用戶各個維度的數據計算,最終輸出一個用戶的守約畫像。」毛仁歆說道。機器學習
商業信用評價體系,從一我的的身份特徵、信用歷史、履約能力等方面進行綜合評分,經過機器學習、時序建模、深度學習、網絡分析等技術,精確評估出用戶在不一樣商業場景的守約行爲,信用評估做爲共享經濟中買賣雙方創建信任的紐帶,它的評分規則必須保證客觀和公平,這促使毛仁歆和他的團隊,要不斷提升守約行爲預估的精準度,這樣可讓商家擴大自身業務的同時,有效控制經營風險。ide
隨着信用平臺體系的不斷完善,愈來愈多的網民加入到中國人自創的購物狂歡節中,一個新的產業鏈也隨之誕生。這裏即是新經濟體系下的另外一個環節,工做人員正在把回收的衣服運到清洗車間,衣服通過分揀,被放進大型洗衣機中清洗,而後通過高溫熨燙,臭氧消毒,塑封包裝等環節,進入巨大的服裝倉庫。性能
當共享衣櫥系統,接收到消費者的訂單後,工做人員會從服裝倉庫的幾十萬件衣服中揀選出對應的款式,而後衣服在流水線上被電腦系統細化分揀,打包後快遞發出。學習
藉助於這個信用評估體系,共享衣櫥這種共享經濟消費模式愈來愈受年輕人青睞,隨着共享經濟模式的普及,更多用戶有機會展現本身的守約行爲,積累自身信用,信用評價體系也獲得持續優化,進而刺激了中國消費市場的活力。大數據
信用評估中涉及的機器學習方法由淺到深均有涉及,其從線性、時序和結構數據上進行統一建模的框架即芝麻分背後的DeepCredit技術。傳統評分卡技術,雖然能給每個用戶提供一個可解釋的芝麻分組成,但模型的評估準確度很是依賴底層的特徵工程。近幾年來深度學習技術極大的推進了時序挖掘、圖網絡分析、天然語言處理、圖像識別等領域的發展,也爲更準確的用戶信用畫像評估提供了可能。優化
經過對時序挖掘方法的研究,芝麻信用對深度學習在信用評估中的應用作了探索,其經過對用戶的守約歷史進行時序建模,完整刻畫了一個用戶在時間維度上的守約表現。傳統在金融領域的守約歷史數據挖掘主要依賴開發人員的業務經驗,受到工做量大、特徵維度少等影響,最終沒法達到商業應用的性能要求。在建模過程當中,深度學習中的循環神經網絡(RNN)及其變種時序算法能較好的對序列數據建模,當前在語音識別、機器翻譯、序列預測上都有很是棒的應用。芝麻分團隊首次將多層循環神經網絡應用在數億用戶規模的守約時序行爲上,模型示意圖以下圖所示。經過在模型結構中引入了Stacking、Embedding、Wide&Deep等優化技術,經過算法學習到了用戶的守約習慣,如按時守約、多用多守約等。最終的性能效果相比傳統方法有顯著提高40%+,給商業場景帶來更多的准入用戶、更低的資金成本。
當前芝麻信用已經深刻滲透到支付寶的各個產品當中,同時對外開放向合做夥伴提供服務。芝麻信用也將投入更多精力優化技術,推進商業信用體系的加速到來。