點擊圖片購書html
參與文末話題討論,每日贈送異步圖書程序員
——異步小編算法
前不久,「逃犯看張學友演唱會被抓」的新聞讓很多人都感慨,原來演唱會還能用來幹這個!其實這都是AI面部識別技術的功勞,在支付、安防等領域,AI面部識別技術有着普遍的應用。在互聯網金融信貸風險控制中,咱們也會藉助機器學習和統計分析的模型,對信貸申請者進行「AI面部識別」。即便一個微博、一條朋友圈這些看似日常的我的社交信息,通過AI模型計算後,也能幫助咱們識別出那些可能的「逃犯」——信貸欺詐者。編程
本次公開課將從建模的角度,介紹互聯網金融反欺詐模型的關鍵——如何從信貸申請數據中提取出有用的特徵。實際的建模結果代表,信貸申請人的「社交網絡」特徵每每是最有效的。微信
1|分享嘉賓介紹
我是誰?我爲何要開公開課
網絡
唐亙,數據科學家,《精通數據科學:從線性迴歸到深度學習》一書做者。熱愛並積極參與Apache Spark、 scikit-learn等開源項目。做爲講師和技術顧問爲多家機構(包括惠普,華爲,復旦大學等)提供百餘場技術培訓。架構
在此以前,工做和研究集中於經濟和量化金融,曾參與經合組織(OECD)的研究項目並發表論文,並擔任英國在線出版社Packt的技術審稿人。併發
曾得到復旦大學的數學和計算機雙學士學位;巴黎綜合理工的金融碩士學位;法國國立統計與經濟管理學校的數據科學碩士學位。框架
掃碼識別,進入直播間機器學習
2|分享題目
適合零基礎的你?
分享題目:「社交網絡」分析在互聯網金融反欺詐中的應用
分享概要
在互聯網金融信貸風險控制中,反欺詐識別是很重要的一環。在實踐中,咱們經常藉助機器學習和統計分析的模型從信貸申請中識別出那些可能的欺詐者。從建模的角度來說,如何從申請數據中提取出有用的特徵是模型成功的關鍵,而實際的建模結果代表,申請人或者申請的「社交網絡」特徵是最有效的。
這次分享主要分爲兩個部分,第一部分主要介紹互聯網金融反欺詐所用的數據源和模型框架,爲分享的第二部分作鋪墊;第二部分是分享的重點,將依次介紹
利用申請數據搭建申請人或者申請的「社交網絡」
利用染色等方法找到網絡中可能的欺詐團伙
利用深度學習(deepwalk)的方法將網絡向量化,並和其餘特徵一塊兒搭建模型
分享的技術和模型即包含業內最有效的反欺詐手段,也包含了前沿的研究實驗方向,具備很大的實用性。
分享大綱
互聯網金融反欺詐簡介
搭建社交網絡
挖掘欺詐團伙
深度學習在社交網絡中的應用
大綱詳解
在互聯網金融反欺詐簡介中將介紹以下三個內容。
互聯網金融的業務簡介以及欺詐案例介紹:互聯網金融的業務模式、特色以及公司模型介紹;信貸欺詐特色、規模以及宜人貸欺詐案例介紹
互聯網金融反欺詐(風控)數據源介紹:歷來源的角度來看,數據能夠分爲內部數據和外部數據;從分類的角度來看,數據能夠分爲我的信息數據、通信數據、行爲數據。這一部分將簡單介紹不一樣數據的大體用法,併爲後面的社交網絡作準備
反欺詐模型架構以及模型產出物介紹:與風控模型相似,反欺詐的模型產出大概有兩個,一是基於邏輯迴歸生成相應的欺詐評分模型;二是利用決策樹生成反欺詐規則。這兩種產出都嚴重依賴於特徵提取,特別是社交網絡的特徵提取
在搭建社交網絡這個部分,將主要介紹以下兩個內容。
• 搭建社交網絡的通常步驟:定義節點和邊、搭建異構網絡、摺疊同構網絡、社區發現和染色。
• 經常使用的異構網絡以及同構網絡舉例:利用第一聯繫人、家庭地址等搭建網絡;摺疊成申請爲結點的網絡
在挖掘欺詐團伙的這個部分,將介紹以下的兩個部分
• 一度、二度關聯的特徵提取
• 利用社區發現以及page rank算法(染色算法)進行半監督的學習:LPA算法介紹以及效果展現,page rank算法效果展現。
在深度學習在社交網絡中的應用這一部分,將介紹以下的內容:
• 向量化社交網絡的意義:向量化社交網絡是關鍵的一步,使得社交網絡能夠和其餘特徵一塊兒使用,也方便使用經典的算法對社交網絡進行聚類或分類。
• word2Vec的模型簡介
• deepwalk簡介以及模型效果展現
3|聽課福利
不只有免費公開課,還有禮物送?
福利一:公開課結束,將選出提問的3名讀者,贈送唐亙做品《精通數據科學:從線性迴歸到深度學習》一本。
福利二:選出10名讀者,贈送異步社區20元e讀版圖書現金券一張。
福利三:關注【異步圖書】微信公衆號,回覆「公開課」進入這次公開課微信羣,活動結束後獲取這次演講PPT。
福利四:今日在異步社區購買《精通數據科學:從線性迴歸到深度學習》暢享7折優惠,點擊領取優惠券購書。
4|嘉賓做品
《精通數據科學:從線性迴歸到深度學習》
《精通數據科學:從線性迴歸到深度學習》
唐亙 著
數據科學入門到實戰,介紹數據科學經常使用的工具——Python、數學基礎及模型,討論數據科學的前沿領域——大數據和人工智能,包括機器學習領域經典的模型、分佈式機器學習、神經網絡和深度學習等。
在數據學科的角度,融合了數學、計算機科學、計量經濟學的精髓
爲讀者闡釋了數據科學所要解決的核心問題—數據模型、算法模型的理論內涵和適用範圍
以經常使用的IT工具—Python爲基礎,教會讀者如何建模以及經過算法實現數據模型,具備很強的實操性。
本書還爲讀者詳解了分佈式機器學習、神經網絡、深度學習等大數據和人工智能的前沿技術。
今日互動
針對今天的公開課,有什麼想法?有哪些疑問?爲何?截止時間6月6日12時,留言+轉發本活動到朋友圈,小編將抽獎選出3名讀者贈送紙書1本和2張e讀版80元異步社區代金券,(留言點贊最多的自動得到一張)。
異步圖書後臺回覆「5月新書」進入新書交流羣,得到第一手新書信息
推薦閱讀
天天與你分享IT好文。
在「異步圖書」微信後臺回覆「關注」,便可免費得到2000門在線視頻課程
點擊閱讀原文,購買《精通數據科學:從線性迴歸到深度學習》