最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!

凡是搞計量經濟的,都關注這個號了git

稿件:econometrics666@126.com正則表達式

全部計量經濟圈方法論叢的code程序, 宏微觀數據庫和各類軟件都放在社羣裏.歡迎到計量經濟圈社羣交流訪問.算法

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!

關於機器學習在計量分析中的應用,各位學者能夠參閱以下文章:1.Python中的計量回歸模塊及全部模塊概覽,2.空間計量軟件代碼資源集錦(Matlab/R/Python/SAS/Stata), 再也不因空間效應而感到孤獨,3.迴歸、分類與聚類:三大方向剖解機器學習算法的優缺點(附Python和R實現),4.機器學習第一書, 數據挖掘, 推理和預測,5.從線性迴歸到機器學習, 一張圖幫你文獻綜述,6.11種與機器學習相關的多元變量分析方法彙總,7.機器學習和大數據計量經濟學, 你必須閱讀一下這篇,8.機器學習與Econometrics的書籍推薦, 值得擁有的經典,9.機器學習在微觀計量的應用最新趨勢: 大數據和因果推斷,10.機器學習在微觀計量的應用最新趨勢: 迴歸模型,11.機器學習對計量經濟學的影響, AEA年會獨家報道,12.機器學習,可異於數理統計,13.Python, Stata, R軟件史上最全快捷鍵合輯!,14.Python與Stata, R, SAS, SQL在數據處理上的比較, 含code及細緻講解,15.Python作因果推斷的方法示例, 解讀與code,16.文本分析的步驟, 工具, 途徑和可視化如何作?17.文本大數據分析在經濟學和金融學中的應用, 最全文獻綜述,18.文本函數和正則表達式, 文本分析事無鉅細。數據庫

前面,咱們引薦了①「機器學習方法出如今AER, JPE, QJE等頂刊上了!」,②前沿: 機器學習在金融和能源經濟領域的應用分類總結,③Lasso, 嶺迴歸, 彈性網估計在軟件中的實現流程和示例解讀」,④迴歸方法深度剖析(OLS, RIDGE, ENET, LASSO, SCAD, MCP, QR),⑤高維迴歸方法: Ridge, Lasso, Elastic Net用了嗎,⑥Lasso迴歸操做指南, 數據, 程序和解讀都有,⑦七種經常使用迴歸技術,如何正確選擇迴歸模型?,⑧共線性、過分/不能識別問題的Solutions,⑨計量經濟學與實驗經濟學的若干新近發展及展望,⑩計量經濟學新進展,供參考等,在學術同行間引發巨大反響。安全

機器學習方法逐漸在經濟管理等社科類頂刊,如AER,JPE,QJE,JOF等期刊上出現了。爲了進一步瞭解機器學習在國外最新應用動向,咱們爲各位學者奉上「深度學習在金融領域的現狀彙總與前沿瞻望」。對機器學習方法感興趣的學者,建議認真研讀這篇很是重要、全面的文章。br/>**正文**
關於下方文字內容,做者:陳慶衝,東北財經大學金融工程,通訊郵箱:yukichen1213@163.com
《深度學習在金融領域的現狀彙總與前沿瞻望》
Deep Learning for Financial Applications : A Survey
引言
機器學習(Machine Learning,ML)發展至今,已在金融領域發光發熱。而深度學習(Deep Learning,DL)因爲其優越的表現,現階段受到普遍關注,金融領域正是深度學習的新興領域,且處於活躍狀態。這篇文章除了對深度學習的算法原理進行介紹外,主要關注如下幾個問題:1.深度學習在金融領域的應用包括哪些?2.目前在各領域的研究進度如何?3.還有哪些有潛力的應用領域?4.哪種深度學習模型更被青睞?5.深度學習與機器學習相比,哪個更適合用做研究?6.深度學習的將來方向是什麼?
深度學習算法介紹
深度學習(DL)是一種特殊類型的機器學習(ML),它由多層神經網絡複合而成,屬於複雜度較高的模型。咱們對將介紹其中改的七種分支:深層感知器(Deep Multilayer Perceptron,DMLP)、卷積神經網絡(Convolutional Neural Networks, CNN)、循環神經網絡(Recurrent Neural Network, RNN)、長短時間記憶網絡(Long Short-Term Memory, LSTM)、限制玻爾茲曼機(Restricted Boltzmann Machines, RBMs)、深度信念網絡(Deep Belief Networks, DBNs)、自編碼器(Autoencoders, AEs)。
1.多層感知機(DMLP)網絡

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
深層感知器與多層感知器(MLP)相似,由輸入層、隱含層和輸出層組成,但層數較多。對於每層的神經元,都有對應的輸入項x、權重w和誤差b。神經網絡中的一個神經元輸出如式(1):
(1)
此外,每一個神經元都有一個非線性激活函數,該函數經過對前一層神經元的輸出加權求和產生該層神經元的輸出。經常使用激活函數包括:Sigmoid函數、雙曲正切函數(hyperbolic tangent)、Relu函數(Rectified Linear Unit)、Leaky Relu函數、Swish函數和Softmax函數。
深層感知器與多層感知器相比,具備更好的分類和迴歸性能。深層感知器的學習過程經過反向傳播實現,輸出層神經元的輸出偏差會反映到前一層神經元上,並對其進行修正,而隨機梯度降低法(SGD)是最經常使用的更新權重的方法。
2.卷積神經網絡(CNNs)架構

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
卷積神經網絡(CNN)是一種深度神經網絡(DNN),主要在圖像分類及識別領域運用。整個圖像由1x一、3x三、5x5等尺寸的過濾器掃描,並由不一樣類型的層造成架構:輸入層、卷積層、池化層(平均值或最大值)、全鏈接層與輸出層,是一種經常使用的前饋型神經網絡。
3.遞歸神經網絡(RNN)app

遞歸神經網絡處理的數據規格較爲特殊,常限定於序列數據:如時間序列、音頻和語音數據、文字等,常被用於手寫文字識別、語音識別等。
與前饋型網絡不一樣,遞歸神經網絡使用內部存儲器對輸入進行處理。存在不一樣類型的遞歸神經網絡結構,如一對1、多對一與多對多。RNN對每一個輸入進行處理,隱含層中的神經元將輸入項的歷史信息包含在「狀態向量」(state vector)裏。訓練方法常使用時間反向傳播法(BPTT),原理爲:t時刻損失函數的微分反映了前一時刻的權值。但該類神經網絡的訓練比前饋神經網絡更困難,且週期較長。
4.長短時記憶網絡(LSTM)框架

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
長短時記憶網絡是處理序列數據的深度學習算法。優點在於能夠對網絡中的短時間值與長期值同時進行記憶,所以普遍使用於語音識別、語音翻譯、手寫字符識別、時間序列數據預測等領域。LSTM網絡由LSTM神經元組成,LSTM神經元又由三扇門構成:遺忘門(forget gate)、輸入門(input gate)、輸出門(output gate)。這三扇門對信息流進行控制。經過這些結構特徵,每一個神經元能夠在任意的時間間隔內記住所需的值,若干個LSTM神經元又組成了神經網絡層。
5.限制玻爾茲曼機(RBMs)dom

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
RBM能夠對輸入集的機率分佈進行學習,主要用於降維、分類和特徵學習。RBM是一個兩層(可見層與隱含層,兩層間不鏈接)的二部無向圖模型,每層的神經元互不鏈接。每一個神經元都具備對輸入進行計算的能力,並隨機決策是否執行計算。在計算時,輸入值使用特定的權重加權,再添加特定的誤差,並經過激活函數傳遞計算值。隨後,在重構階段,輸出的結果做爲輸入從新進入網絡,再做爲輸出從可見層退出,最後比較前一個輸入的值和處理後的值。RBM的缺點是訓練過程較爲複雜,儘管有對於對數似然梯度進行估計的好方法,但對於對數似然自己的估計並不容易。
6.深度信念網絡(DBNs)

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
DBN由一組RBM層組成,由潛在變量組成的機率生成模型。DBNs用於使用非監督方法在輸入集中尋找獨立特徵。DBM能夠在訓練過程當中學習以機率方式重構輸入集。隨後,網絡中的各層開始檢測鑑別特徵,在學習過程完成後,對分類進行監督學習。
7.自編碼器(AEs)

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
自編碼器經常使用於特徵提取和降維,經過從新對輸入進行映射,是輸入更能對分類起到做用,換而言之,該算法在執行一個無監督的特徵學習過程。AEs包含編碼器和解碼器兩部分,結構與前饋型神經網絡類似,由輸入層、輸出層和一個(多個)隱含層組成,且輸入層和輸出層所包含神經元個數相同,呈對稱狀態。特徵提取與降維後會損失掉原有的數據內部關係等信息,是AEs的一個缺陷。
8.其餘模型

DL模型除了包括上述7個模型外,較經常使用的還有深度強化學習(Deep Reinforcement Learning, DRL)、生成式對抗網絡(Generative Adversarial Networks, GANs)、膠囊網絡(Capsule Networks, Deep Gaussian Processes, DGPs)。但除了DRL外,其餘兩個模型暫未被學者們投入金融的研究中,但仍能夠對其潛力進行期待。
DL在金融領域中的應用
在已有的文獻中,深度學習與金融領域的結合較多。與此同時,還有不少領域未被充分挖掘,目前已有的研究領域可分爲如下幾類:
1.算法交易(Algorithmic Trading)

算法交易是僅由算法模型,不經過人類的決策作出的買入與拋售決定。這些決策不只能夠基於簡單的線性規則與數學模型,也可使用ML/DL來對交易策略進行優化。隨着網上交易平臺的引入,算法交易在過去20年幾乎接管了金融行業,而基於深度學習的algo(algorand)交易模型開始受到大量關注。
Algo-trading應用程序一般與價格預測模型進行結合,對市場的時機進行迅速選擇,其本質在於對買賣信號的價格/趨勢進行預測;也能夠經過優化交易參數(包含買賣價差、
訂單簿分析、頭寸規模),來關注交易自己的動態。高頻交易(HFT)的研究人員對深度學習的應用十分感興趣,並運用於高頻交易研究中。
本文將學者們對基於DL模型的Algo-trading 研究的過去與現狀進行了梳理,主要分爲3個板塊:1嵌入時間序列預測模型的算法交易2基於分類(買賣信號、趨勢預測)的算法交易模型3其餘的獨立研究或算法交易模型(配對交易、套利等)。
1.1 時間序列預測與算法交易
大多數的算法交易研究都集中在對股票或指數價格的預測上,而長短時記憶網絡(LSTM)是其中最受歡迎的模型。而LSTM經常與其餘算法進行結合使用,包括且不限於小波變換WT(Wei et al.,2017)、卷積神經網絡CNN(Liu et al.,2017)等。除了LSTM外,對於股票價格預測的模型各有千秋,Zhang et al.(2017)提出了可處理多種頻率交易的股票價格預測模型SFM;Deng et al.(2017)使用了FDDR模型,能夠預測股價和生成交易信號。此外,學者們選取了不一樣國家的股票數據,加強了深度學習模型的泛用性,其中包括希臘、新加坡、中國等地。與此同時,以比特幣爲首的加密貨幣的交易也受到學者們的普遍關注,彙總表格如表1所示:
表 1 嵌入時間序列預測模型的算法交易
注:如下表格均可以往右滑動,這樣就能看全全部表格內容。
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 土耳其擔保銀行 2016 OCHLV、價差、波動性、換手率等 PLR、Graves改進的LSTM MSE、RMSE、MAE、RSE、相關係數和R2 Spark
2 滬深300、印度Nifty50、恆生指數(HSI)、日經22五、標普500、道瓊斯指數 2010-2016 OCHLV、技術指標 WT、Stacked autoencoders、LSTM MAPE、相關係數、THEILU -
3 中國股市 2007-2017 OCHLV CNN+LSTM 年化收益率、最大回撤 Python
4 紐交所50個股票 2007-2016 價格數據 SFM MSE -
5 芬蘭股市5只股票的市值 2010 要價/報價、成交量 WMTR、MDA 準確率、精確率、召回率、F1分數 -
6 300支深交所股票 2014-2015 價格數據 FDDR、DNN+RL 利潤、回報、SR Keras
7 標普500指數 1989-2005 價格數據、成交量 LSTM 回報、STD、SR、準確率 Python、TensorFlow、Keras、R、H2O
8 希臘銀行股票(ETE) 2009-2014 FTSE100、道瓊斯指數、GDAX交易所、日經22五、歐元美圓匯率、黃金 GASVR、LSTM 回報、波動性、SR、準確率 TensorFlow
9 中國IF-IH-IC股指期貨 2016-2017 價格變更 MODRL+LSTM 收益與虧損、SR -
10 新加坡股市指數 2010-2017 過去十天指數的OCHL DNN RMSE、MAPE、利潤、SR -
11 英鎊/美圓 2017 價格數據 RL+LSTM+NES SR、下偏比、總利潤 Python、Keras、TensorFlow
12 商品、外匯期貨、ETF 1991-2014 價格數據 DNN SR、CP值、回報 C++、Python
13 美圓/英鎊、標普500、英國富時100(FTSE100)、石油、黃金 2016 價格數據 AE+CNN SR、波動性、平均回報/交易量、回報率 H2O
14 比特幣(Bitcoin)、達世幣(Dash)、瑞波幣(Ripple)、門羅幣(Monero)、萊特幣(Litecoin)、狗幣(Dogecoin)、將來幣(Nxt)、域名幣(Namecoin) 2014-2017 移動平均線(MA)、布林線(BOLL)、CRIX回報、歐洲銀行同業拆借利率、OCHLV LSTM、RNN、MLP 準確率、F1分數 Python、TensorFlow
15 標普500、韓國KOSPI指數、恆生指數和歐洲斯托克50指數 1987-2017 200天股票價格 深度Q-Learning、DNN 總利潤、相關性 -
16 標普500包含的股票 1990-2015 價格數據 DNN、GBT、RF 平均回報、MDD、Calmar比率 H2O
17 基礎數據、技術數據與經濟數據 - 基礎、技術和市場信息 CNN - -
注:
1.特徵集:OCHLV表示開盤價(Open)、收盤價(Close)、最高價(High)、最低價(Low)、成交量(Volume),OCHL同理。
2.算法:PLR(Piecewise Linear Representation):分段線性表示;WT(Wavelet Transforms):小波變換;SFM(State Frequency Memory):狀態頻率存儲器;WMTR(Weighted Multichannel Time-series Regression):加權多通道時間序列迴歸;MDA(Multilinear Discriminant Analysis):多線性判別分析;FDDR(Fuzzy Deep Direct Reinforcement Learning):模糊深層直接強化學習;RL(Reinforcement Learning):強化學習;GASVR(GA with a SVR):遺傳算法+支持向量迴歸機;MODRL(Multi-objective Deep Reinforcement Learning):多目標深層強化學習;NES(Natural Language Processing):天然進化策略;DNN(Deep Neural Network):深度神經網絡;RF(Random Forest):隨機森林;GBT(Gradient Boosted Trees):梯度提高樹
3.性能指標:MSE(Mean Squared Error):均方偏差;RMSE(Root Mean Square Error):標準偏差;MAE(Mean Absolute Error):平均絕對偏差;RSE(Relative Squared Error):相對平方偏差;STD(Standard Deviation):標準差;SR(Sharpe-ratio):夏普比率;MDD(Maximum Drawdown):最大浮動虧損
1.2 分類與算法交易
除了上述算法交易外,啓發式算法與深度學習算法的結合也被學者們進行開發,並多用於股票的技術層面分析,Sezer et al.(2017)採用遺傳算法(GA)對技術指標進行優化,並用做提升預測的精度;此外,MACD也被用來預測股票的價格走勢(Troiano et al.,2018)。除股票價格預測外,分類算法也是深度學習與算法交易結合的一個重要領域。如,因爲CNN在圖像分類問題上運用普遍,其被用來將財務輸入數據轉換爲圖像(Gudelek et al.,2017)。除了對圖像的轉換外,Sezer et al.(2019)將條形圖圖像做爲CNN的輸入,並預測了圖像中的點將來會買進、持有仍是賣出,並開發了相應的算法交易模型。表2對算法交易中的分類算法進行了彙總:
表 2 基於分類的算法交易模型
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 道瓊斯30指數中的股票 1997-2017 RSI 遺傳算法修參的DMLP 年化收益率 Spark MLlib、Java
2 標普500ETF,十隻來自標普500的股票 2014-2016 價格數據 FFNN 累計收益 MatConvNet、Matlab
3 道瓊斯30股票 2012-2016 收盤價和若干個技術指標 LSTM 準確率 Python、Keras、Tensorflow、TALIB
4 全部高頻交易記錄 2014-2017 價格數據,訂單與交易 LSTM 準確率 -
5 納斯達克交易所 2010 LOB中的價格與交易量 LSTM 精確率、召回率、F1分數、kappa係數 -
6 17個ETF 2000-2016 價格數據,技術指標 CNN 準確率、MSE、利潤、AUROC Keras、Tensorflow
7 道瓊斯30股票和9個最大交易量的ETF 1997-2017 價格數據,技術指標 CNN+圖像特徵 召回率、精確率、F1分數、年化收益率 Python、TensorFlow、Keras、Java
8 英國富時100 2000-2017 價格數據 CAE TR、SR、MDD、平均回報 -
9 納斯達克交易所 2010 價格,交易量,10個LOB中的訂單 CNN 精確率、召回率、F1分數、kappa係數 Theano、Scikitlearn、Python
10 土耳其Borsa Istanbul 100指數中的股票 2011-2015 75項技術指標與OCHLV CNN 準確率 Keras
11 ETF和道瓊斯30指數 1997-2007 價格數據 CNN+圖像特徵 年化收益率 Keras、Tensorflow
12 8項債券/衍生品市場中的實驗資產 - 資產價格數據 RL、DNN、遺傳算法 學習偏差與遺傳算法偏差 -
13 10只來自標普500的股票 - 股票價格 TDNN、RNN、PNN 遺失率、虛警率 -
14 倫交所 2007-2008 訂單簿、交易、買/賣訂單,刪除訂單 CNN 準確率、kappa係數 Caffe
15 加密貨幣,比特幣 2014-2017 價格數據 CNN、RNN、LSTM 累計投資組合價值、MDD、SR -
注:
1.特徵集:RSI(Relative Strength Index):相對強弱指數;LOB(Limit Order Book Data):訂單簿
2.算法:FFNN(Feedforward Neural Network):前向反饋神經網絡;CAE(Convolutional Autoencoder):卷積自編碼器;TDNN(Timedelay Neural Network):時延神經網絡;PNN(Probabilistic Neural Network):機率神經網絡
3.性能指標:AUROC(Area Under the Receiver Operating Characteristics):接收機的工做面積;TR(Total Return):總回報
1.3 算法交易的其餘領域模型
除了股票的價格預測外,看漲期權和看跌期權的價格預測也受到了學者的關注(Tino et al.,2001)。對於文本數據的挖掘也有助於算法交易,Bari et al.(2018)利用文本挖掘從金融新聞中提取信息,並利用LSTM、RNN、GRU三種算法生成交易信號。表3介紹了其餘領域的彙總:
表 3 其餘算法交易模型
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 德國DAX、英國富時100指數、看漲/看跌期權 1991-1998 價格數據 馬爾科夫模型、RNN 日利潤的均值和標準差 -
2 臺灣股指期貨、迷你股指期貨 2012-2014 圖像中的價格數據 可視化方法+CNN 累計利潤、準確率 -
3 標普500中的能源部門/核心公司 2015-2016 文本與價格數據 LSTM、RNN、GRU 回報、夏普比率、精確率、召回率、準確率 Python、Tweepy API
4 芝商所信息 2016 訂單簿、時間戳、價格數據 RNN 精確率、召回率、F1分數 Python、TensorFlow、R
5 臺灣股指期貨(TAIFEX) 2017 價格數據 RL+CNN預處理 準確率 -
6 標普500中的股票 2010-2016 OCHLV DCNL PCC、DTW、VWL Pytorch
7 來自今日新聞網、蘋果日報、自由時報、理財網中的關於18只股票的新聞 2013-2014 文本、觀點 DNN 回報 Python、Tensorflow
8 來自標普500的和納斯達克100的489只股票 2014-2015 訂單簿 空間神經網絡 交叉熵偏差 NVIDIA’s cuDNN
9 實驗數據集 - 價格數據 由CNN、LSTM、GRU和MLP組成的深度強化學習 平均利潤 Python
注:
1.算法:GRU(Gated-Recurrent Unit):門控循環單元;DCNL(Deep Co-investment Network Learning):參與投資的深度學習網絡
2.性能指標:PCC(Pearson’s Correlation Coefficient):皮爾森相關係數;DTW(Dynamic Time Warping):動態時間規整;VWL(WL Kernel-based Method):核函數方法
2.風險評估(Risk Assessment)

深度學習研究還做用於風險評估領域,它對於給定資產、公司、我的、產品與銀行等的風險進行識別與評估。細分方向包括:破產預測、信用評分、貸款/保險承保、債券評級、貸款申請、消費信貸肯定、企業信用評級、抵押貸款選擇、財務困境預測等,在這些領域中,風險情況的識別相當重要。若未進行合適的風險評估,後果嚴重性不可想象:如2008年房地產泡沫的破裂就是一個較爲有表明的例子。
信用風險評估大多集中在1信用評分和銀行困境分類,也有部分論文研究2抵押貸款違約的可能性、風險交易檢測與危機預測。
2.1 信用評分與困境
信用評級一直是一個熱門話題,因爲其所涉及維度較多,且主觀性較強,目前常出現於各大數據競賽中(Kaggle、天池等)。深度學習在此方面表現良好,Yu et al.(2018)採用DBN+SVM,將預測準確率達到了80-90%。除了對評級得分這種連續型數值外,信用風險分類的運用也較爲普遍,如Neagoe et al.(2018)利用DMLP和深度CNN對信用評分進行分類,詳情如表4所示:
表 4 信用評分與困境分類
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 信用違約掉期 2016 回收率、傳播路徑、部門和地區 DBN+RBM AUROC、FN、FP、準確率 WEKA
2 德國、日本信貸數據集 - 我的金融變量 SVM+DBN 加權準確率、TP、TN -
3 來自Kaggle平臺的信貸數據 - 我的金融變量 DNN 準確率、TP、TN、G-mean指標 -
4 澳大利亞、德國信貸數據 - 我的金融變量 GP+AE優化DNN FP Python、Scikitlearn
5 澳大利亞、德國信貸數據 - 我的金融變量 DCNN、MLP 準確率、虛警、漏警 -
6 來自中國金融公司的消費者信貸數據 - 使用Relief算法選擇50個最重要的維度 CNN+ Relief AUROC、K統計量、準確率 Keras
7 來自UCI 機器學習repo的信貸數據集 - UCI信貸數據集 雙曲正切函數、maxout函數、Rectifier函數 - AWS、EC二、H2O、R
注:
1.性能指標:FN(False Negative):假陰性;FP(False Positive):假陽性;TN(True Negative):真陰性;TP(True Positive):真陽性
2.2 財務困境預測
銀行和企業的財務困境預測,一直是比較難以解決的問題,而深度學習的出現對此問題產生了必定的攻克。Lanbouri and Achchab(2015)將DBN與SVM混合,用於財務困境預測,取得了較高的準確率;Ronnqvist and Sarlin(2015)對文字信息進行提取,並根據語意向量表示銀行壓力,對閾值進行分類,識別銀行的財務困境,更多相似研究如表5所示:
表 5 財務困境、破產、銀行風險、組合風險與危機預測研究
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 966家法國公司 - 財務比率 RBM+SVM 精確率、召回率 -
2 883家來自EDGAR的銀行持股公司 2006-2017 代幣、加權情感極性、槓桿率和ROA CNN、LSTM、SVM、RF 準確率、精確率、召回率、F1分數 Keras、Python、Scikitlearn
3 大型歐洲銀行的事件數據集、路透社的新聞文章 2007-2014 單詞與句子 DNN+NLP預處理 相對實用性、F1分數 -
4 歐洲銀行的事件數據集、路透社的新聞 2007-2014 文本與句子 句子向量+DFFN 實用性、F1分數、AUROC -
5 路透社的新聞、財務數據 2007-2014 財務指標和新聞文本 doc2vec+NN 相對實用性 Doc2vec
6 宏微觀經濟變量、來自銀行持股公司的銀行特徵/績效變量 1976-2017 宏觀經濟變量和銀行績效 CGAN、MVN、MV-t、LSTM、VAR、FE-QAR RMSE、對數似然值、貸款損失率 -
7 法國公司的財務報表 2002-2006 財務比率 DBN 召回率、精確率、F1分數、FP、FN -
8 來自證券價格研究中心的美國上市公司股票回報 2001-2011 價格數據 DBN 準確率 Python、Theano
9 幾個來自日本股票市場的公司財務報表 2002-2016 財務比率 CNN F1分數、AUROC -
10 包含當地和全國經濟因素的投資組合數據集 1995-2014 與特徵有關的投資組合 ANN 負對數似然值 AWS
11 來自挪威金融集團的投資組合數據、挪威銀行 2012-2016 我的財務變量 CNN 準確率、敏感性、特異性、AUROC -
12 私人經紀公司的真實風險交易數據 - 訂單詳情等250個特徵 CNN、LSTM F1分數 Keras、Tensorflow
13 由幾個數據集拼合而成 1996-2017 指數數據、10年期債券收益率、匯率 Logit、CART、RF、SVM、NN、XGBoost、DNN AUROC、KS、G-mean值、似然比率、DP、BA、WBA R
注:
1.特徵集:ROA(Return on Assets):總資產回報率
2.算法:NLP(Natural Language Processing):天然語言處理;DFNN(Deep Feedforward Neural Network):深層前饋網絡;NN(Neural Network):神經網絡;CGAN(Conditional GAN):有條件的GAN;GAN(Generative Adversarial Networks):生成式對抗網絡;MVN(Multivariate Normal Distribution):多元高斯分佈;MV-t(Multivariate t Distribution):多元t分佈;VAR(Vector Auto Regression):向量自相關;FE-QAR(Fixed Effects Quantile VAR):基於VAR的固定效應分位數迴歸;CART(Classification and Regression Trees):分類樹和迴歸樹;XGBoost(eXtreme Grandient Boosting):XGBoost算法
3.性能指標:KS(Kolmogorov-Smirnov):KS檢驗造成的指標;DP(Discriminant Power):判別力;BA(Balanced Accuracy):平衡精度;WBA(Weighted Balanced Accuracy):加權平衡精度
3.欺詐預測(Fraud Detection)

隨着金融中介規模的不斷擴大,金融欺詐現在成爲各國政府和當局拼命尋求解決辦法的領域之一。信用卡詐騙、洗錢、消費信貸詐騙、偷稅漏稅、銀行詐騙等金融詐騙案件層出不窮。這類研究大可能是異常檢測,一般劃分爲分類問題。Roy et al.(2018)使用LSTM模型進行信用卡欺詐檢測,Wang et al.(2018)利用LSTM從信用卡交易序列中檢測出信用卡詐騙,並用精度與其餘算法進行了比較,研究如表6所示:
表 6 反欺詐研究
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 印度尼西亞一家當地銀行的藉機卡交易記錄 2016-2017 在若干時間段中的交易量 CNN、疊加LSTM、CNN-LSTM AUROC -
2 來自零售銀行的信用卡交易 2017 交易變量和幾個衍生特徵 LSTM、GRU 準確率 Keras
3 銀行卡的消費記錄 2014-2015 每一個國家目前/起始的欺詐機率、其餘欺詐相關特徵 ANN AUROC -
4 歐洲持卡人的信用卡交易記錄 2013 對我的財務變量進行PCA ANN、RF 召回率、精確率、準確率 -
5 信用卡交易記錄 2015 交易特徵與銀行特徵 LSTM AUROC Keras、Scikitlearn
6 巴西聯邦稅收祕書處對外貿易數據庫 2014 出口貿易、稅、交易、員工、發票等8個特徵 AE MSE H2O、R
7 衆議院公開數據、來自巴西聯邦稅收祕書處的公司數據 2009-2017 巴西國家開支、當事人、支出類別等21個特徵 深度自編碼器 MSE、RMSE H2O、R
8 被標記爲騙保的汽車保險公司真實數據 - 汽車、保險和事故相關特徵 DNN+LDA TP、FP、準確率、精確率、F1分數 -
9 來自一個巨大的在線支付平臺的交易記錄 2006 我的財務變量 GBDT+DNN AUROC -
10 金融交易 - 交易數據 LSTM t-SNE -
11 來自希臘公司的實驗數據 - - DQL 收入 Torch
注:
1.算法:LDA(Latent Dirichlet Allocation):文本主題模型;GBDT(Gradient-Boosted-Decision Trees):梯度降低樹;DQL(Deep Q-Learning):深度Q學習
2.性能指標:t-SNE(t-distributed stochastic neighbor embedding):t-
.分佈領域嵌入算法
4.投資組合管理(Portfolio Management)

投資組合管理一般指在預先肯定的時期內,構建一個投資組合選擇各類資產的過程。主要關注如下領域:投資組合優化、投資組合選擇、投資組合配置。投資組合管理實質上是一個優化的過程,許多模型應運而生。Takeuchi et al.(2013)根據預期收益將股票分紅低動量與高動量兩組,使用了深度RBM網絡,得到了較高的收益。除此以外,深度強化學習(DRL)被選爲主要的深度學習模型,被普遍運用,文獻綜述如表7所示:
表 7 投資組合管理研究
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 加密貨幣、比特幣 2014-2017 價格數據 CNN、RNN、LSTM 累計投資組合價值、MDD、SR -
2 來自紐交所、美交所、納斯達克交易所的股票 1965-2009 價格數據 自動編碼器+RBM 準確率、混淆矩陣 -
3 20只標普500中的股票 2012-2015 技術指標 MLP 準確率 Python、Scikitlearn、Keras、Theano
4 中國股票數據 2012-2013 技術指標與基本指標 邏輯迴歸、RF、DNN AUC、準確率、精確率、召回率、真正例率、反正例率 Keras、Tensorflow、Python、Scikitlearn
5 標普500中最大的5個公司 - 價格數據與財務比率 LSTM、自動編碼器、智能索引 CAGR -
6 納斯達克生物科技交易所基金 2012-2016 價格數據 自動編碼器、校準驗證 回報 -
7 臺灣股票市場 - 價格數據 Elman神經網絡、RNN MSE、回報 -
8 外匯(EUR/USD)、黃金 2013 價格數據 RNN 回報 Python
9 紐交所、美交所、納斯達克交易所的股票日內交易數據 1993-2017 價格、15種公司特徵 LSTM+MLP 月回報、SR Python、Keras、Tensorflow in AWS
10 標普500 1985-2006 月度和日度的對數回報 DBN+MLP 檢驗偏差 Theano、Python、Matlab
11 10只標普500中的股票 1997-2016 OCHLV、價格數據 RNN、LSTM、GRU 準確率、月回報 Keras、Tensorflow
12 東京和大阪證券交易所的分析報告 2016-2018 文本 LSTM、CNN、Bi-LSTM 準確率、R2 R、Python、Matlab
13 中國/美國股票市場中的股票 2015-2018 OCHLV、基本面數據 DDPG、PPO SR、MDD Keras、Python、MeCab
14 對衝基金月度回報數據 1996-2015 回報、SR、STD、偏度、風度、歐米茄比率、基金中的alpha DNN 夏普比率、年回報、累計回報 -
15 12種交易量最大的加密貨幣 2015-2016 價格數據 CNN+RL SR、投資組合價值、MDD -
注:
1.算法:Bi-LSTM(Bidirectional LSTM):雙向LSTM ;DDPG(Deep Deterministic Policy Gradient):深度肯定性策略梯度;PPO(Proximal Policy Optimization):深度加強學習
2.性能指標:AUC(Area Under the Curve):曲線下方面積;CAGR(Compound Annual Growth Rate):複合增加率
5.資產訂價與衍生品市場(Asset Pricing and Derivatives Market)

資產的準肯定價與估值問題是金融學的一個研究領域。機器學習在銀行、企業、房地產、衍生品產品中的運用很普遍,但深度學習尚未普遍應用到該領域。深度學習模型可能在這個領域發光發熱,但目前研究僅有少數幾項,如表8所示:
表 8 資產訂價與衍生品市場研究
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 東京和大阪證券交易所的分析報告 2016-2018 文本 LSTM、CNN、Bi-LSTM 準確率、R2 R、Python、MeCab
2 模擬一系列看漲期權價格 - 價格信息、執行價格、期限、股利、無風險利率、波動性 DNN RMSE、平均訂價偏差百分比 Tensorflow
3 臺灣指數(TAIEX) 2017 OCHLV、基本面分析、期權價格 MLP、使用斯科爾斯期權訂價模型的MLP RMSE、MAE、MAPE -
4 紐交所、美交所和納斯達克交易所的回報 1975-2017 57個公司特徵 Fama-French n因子模型 R二、RMSE Tensorflow
加密貨幣和區塊鏈研究(Cryptocurrency and Blockchain Studies)

加密貨幣在過去幾年一直被人們津津樂道,由於它們能夠在短期內完成難以置信的價格漲跌,而區塊鏈做爲一個分佈式的帳本系統,很好地適應了加密貨幣,二者高度耦合。學者們使用深度學習模型,對加密貨幣算法交易模型與價格預測作出了嘗試:Lopes et al.(2018)將市場與加密貨幣交易的價格預測相結合,使用CNN和LSTM進行文本挖掘,並以OCHLV的價格、技術指標和情緒分析做爲特徵集,相似研究如表9所示:
表 9 加密貨幣和區塊鏈研究
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 比特幣、達世幣、瑞波幣、門羅幣、狗幣、將來幣、域名幣 2014-2017 MA、BOLL、CRIX日回報、歐洲銀行同業拆借利率、EURO/UK、EURO/USD和US/JPY的OCHLV LSTM、RNN、MLP 準確率、F1分數 Python、Tensorflow
2 加密貨幣、比特幣 2014-2017 價格數據 CNN 累計投資組合價值、MDD、SR -
3 12種交易量最大的比特幣 2015-2016 價格數據 CNN+RL SR、投資組合價值、MDD -
4 比特幣數據 2010-2017 哈希值、比特幣地址、公鑰/私鑰、數字簽名 TS模糊模型、模糊認知圖 層次分析法 -
5 比特幣數據 2012,2013,2016 交易ID、買入/賣出地址、時間戳 啓發式圖嵌入算法、拉普拉斯映射、深度自編碼器 F1分數 -
6 比特幣、萊特幣、推特 2015-2018 OCHLV、技術指標、敏感性分析 CNN、LSTM、狀態頻率模型 MSE Keras、Tensorflow
7 比特幣 2013-2016 價格數據 貝葉斯優化後的RNN、LSTM 敏感性、特異性、精確率、準確率、RMSE Keras、Python、Hyperas
注:
1.特徵集:MA(Moving Average):移動平均線;BOLL(Bollinger Band):布林線;CRIX(The Cryptocurrency Index):加密貨幣指數
7.財務情緒分析和行爲金融學(Financial Sentiment Analysis and Behavioral Finance)

投資者情緒是行爲金融學的一個重要組成成分。文本挖掘技術的崛起爲社交媒體情緒的提取作出了良好的鋪墊。學者們也對該領域較爲感興趣:Kearney et al.(2014)基於調查,使用文本數據對情緒進行了挖掘,此類研究數量較多且方向相似,如表10所示:
表 10 財務情緒的文本挖掘與預測
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 東京、大阪證券交易所的分析報告 2016-2018 文本 LSTM、CNN、Bi-LSTM 準確率、R2 R、Python、Mecab
2 新浪微博、證券市場記錄 2012-2015 技術指標、句子 DRSE F1分數、精確率、召回率、準確率、AUROC Python
3 來自路透社和彭博的關於標普500股票的新聞 2006-2015 財經新聞、價格數據 DeepClue 準確率 Dynet software
4 路透社和彭博新聞,歷史股票安全數據 2006-2013 新聞、價格數據 DNN 準確率 -
5 上證綜合指數價格 2008-2015 變化率的OCHL、價格 情感分析+LSTM MSE -
6 上證綜合指數價格 2013-2016 文本數據和價格數據 LSTM 準確率、F1分數 Python、Keras
7 谷歌、微軟和蘋果公司的股票 2016-2017 推特情感和股票價格 RNN - Spark、Flume、Twitter、API
8 30支道瓊斯股票、標普500、道瓊斯指數、路透社新聞 2002-2016 價格數據、新聞和文章的特徵 LSTM、NN、CNN和word2vec 準確率 VADER
9 滬深300指數的股票及OCHLV 2009-2014 情感帖子、價格數據 樸素貝葉斯+LSTM 精確率、召回率、F1分數、準確率 Python、Keras
10 標普500、紐交所、道瓊斯、納斯達克交易所 2009-2011 推特情緒、指數數據 DNN、CNN 錯誤率 Keras、Theano
注:
1.算法:DRSE(Deep Random Subspace Ensembles):深度隨機子空間集成
8.金融文本挖掘(Financial Text Mining)

隨着社交媒體和實時媒體/推文的迅速傳播,基於文本的即時信息檢索成爲金融模型開發的可用工具,所以,近幾年來金融文本挖掘變得很是流行,有僅用於預測的,也有僅用做情緒分析的,同時存在其餘類型。
8.1 以預測爲目的
Huynh et al.(2017)利用路透社、彭博社的財經新聞和股價數據對將來的股價走勢進行預測;Dang et al.(2018)利用Stock2Vec模型與兩流GRU模型,從金融新聞和股票價格中生成輸入數據,對股票價格進行分類,相似研究如表11所示:
表 11 以預測爲目的,不含情感分析的文本挖掘研究
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 標普500中的能源部門/核心公司 2015-2016 文本和價格數據
回報、SR、精確率、召回率、準確率 Python、Tweepy API
2 來自路透社和彭博的新聞 2006-2013 財經新聞、價格數據 Bi-GRU 準確率 Python、Keras
3 來自新浪網的新聞、ACE2005中文標註語料庫 2012-2016 一系列新聞文本 獨特算法 精確率、召回率、F1分數 -
4 德國CDAX股票市場數據 2010-2013 財經新聞、股票市場價格 LSTM MSE、RMSE、MAE、準確率、AUC TensorFlow、Theano、Python、Scikit-Learn
5 來自路透社和彭博的蘋果、空中客車公司、亞馬遜新聞、標普500股票價格 2006-2013 價格數據、新聞、技術指標 TGRU、stock2vec 準確率、精確率、AUROC Keras、Python
6 標普500指數、15只標普500股票 2006-2013 路透社和彭博新聞 CNN 準確率、MCC -
7 來自路透社的標普500指數新聞 2006-2013 財經新聞標題、技術指標 SI-RCNN(LSTM+CNN) 準確率 -
8 10隻日經225成分股和新聞 2001-2008 文本信息和股票價格 段落向量+LSTM 利潤 -
9 印度NIFTY50指數、銀行/汽車/互聯網/能源行業指數、新聞 2013--2017 指數數據、新聞 LSTM MCC、準確率 -
10 價格數據、指數數據、新聞、社會媒體數據 2015 價格數據、來自文章和社交媒體的新聞 耦合矩陣和張量 準確率、MCC Jieba
11 滬深300 2015-2017 社交媒體新聞、價格數據 文檔生成模型與RNN-Boost 準確率、MAE、MAPE、RMSE Python、Scikitlearn
12 新聞和中國股票數據 2014-2017 新聞中的選詞 HAN 準確率、年回報 -
13 新聞,來自港交所的價格數據 2001 價格數據和來自新聞的TF-IDF ELM、DLR、PCA、BELM、KELM、NN 準確率 Matlab
14 臺灣TWSE指數、4只TWSE成分股 2001-2017 技術指標、價格數據、新聞 CNN+LSTM RMSE、利潤 Keras、Python、TALIB
15 Tsugami公司的股票 2013 價格數據 LSTM RMSE Keras、Tensorflow
16 新聞、Nikkei股票的均值、10個Nikkei成分公司 1999-2008 新聞、MACD RNN、RBM+DBN 準確率、P值 -
17 ISMIS2017礦業競爭比賽數據 - 專項標示符、分類 LSTM+GRU+FFNN 準確率 -
18 路透社和彭博新聞、標普500指數價格 2006-2013 新聞和句子 LSTM 準確率 -
19 標普500、來自路透社的新聞 2011-2017 輸入新聞、OCHLV、技術指標 CNN+LSTM、CNN+SVM 準確率、F1分數 Tensorflow
20 日經225指數、標普500指數、來自路透社和彭博的新聞 2001-2013 股票價格數據和新聞 DGM 準確率、MCC、利潤率 -
21 標普500成分股 2006-2013 文本(新聞)和價格數據 LAR+新聞、RF+新聞 MAPE、RMSE -
注:
1.特徵集:TF-IDF(Term Frequency-Inverse Document Frequency):詞頻-逆文檔頻率
2.算法:Bi-GRU(Bidirectional GRU):雙向門控循環單元 ;TGRU(Two-stream GRU):雙流門控循環單元;HAN(Hybrid Attention Network):混合注意力網絡;ELM(Extreme Learning Machine):極限學習機;DLR(Deep Learning Representation):深度表徵學習;PCA(Principal Component Analysis):層次分析法;BELM(Basic Extreme Learning Machine):基礎極限學習機;KELM(Kernel Extreme Learning Machine):核極限學習機;LAR(Linear Auto-regression Predictor):線性自迴歸預測;
3.性能指標:MCC(Matthew Correlation Coefficient):馬修斯相關係數
8.2 以情感分析爲目的
Yoshihara et al.(2014)提出了一種新的方法,將RBM、DBN和詞嵌入相結合,爲RNN-RBM-DBN網絡建立詞向量預測股票價格;Cristo et al.(2015)將股票價格和詞嵌入都用於股票價格預測,取得了較好的效果,相關研究如表12所示:
表 12 金融情緒研究與不含預測的文本挖掘
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 883家來自EDGAR的銀行持股公司 2006-2017 代幣、加權情感極性、槓桿率和ROA、 CNN、LSTM、SVM、隨機森林 準確率、精確率、召回率、F1分數 Keras、Python、Scikitlearn
2 2017年SemEval數據集、金融文本、新聞、股票市場數據 2017 博客中的情感、新聞標題 集成SVR、CNN、LSTM、GRU 餘弦類似度、等級得分、贊同得分 Python、Keras、Scikitlearn
3 來自路透社的金融新聞 2006-2015 詞向量、詞彙與語境輸入 Tree-LSTM 累計超額收益率(CAR) -
4 來自推特的股票情感分析 2015 Stock-Twits中的信息 LSTM、Doc2Vec、CNN 準確率、精確率、召回率、f得分、AUC -
5 新浪微博、股票市場記錄 2012-2015 技術指標、句子 DRSE F1得分、精確率、召回率、準確率、AUROC Python
6 來自今日新聞網、蘋果日報、自由時報、理財網的關於18只股票的新聞 2013-2014 文本、情感 - 回報 Python、Tensorflow
7 推特 2008-2016 句子、Stock-Twits中的信息 CNN、LSTM、GRU MCC、WSURT Keras、Tensorflow
8 日本公司的財務報表 - 句子、文本 DNN 精確率、召回率、F得分 -
9 推特文章、新聞標題 - 句子、文本 Deep-FASP 準確率、MSE、R2 -
10 論壇數據 2004-2013 句子和關鍵詞 遞歸神經網絡 精確率、召回率、F得分 -
11 金融時報中與美國股票相關的新聞 - 新聞標題中的情緒 SVR、雙向LSTM 餘弦類似度 Python、Scikitlearn、Keras、Tensorflow
注:
1.性能指標:WSURT(Wilcoxon Sum-rank Test):Wlicoxon和秩檢驗
8.3 其餘文本挖掘研究
文本挖掘研究還能夠用做許多其餘領域,如Wang et al.(2018)利用文本挖掘和DNN模型對汽車保險詐騙進行檢測,Sarlin et al.(2015)經過提取新聞語義,肯定銀行壓力,並將其與相關事件進行分類,更多研究如表13所示:
表 13 其餘文本挖掘研究
編號 數據集 時間段 特徵集 算法 性能指標 運行環境
1 來自今日新聞網、蘋果日報、自由時報、理財網的關於18只股票的新聞 2013-2014 文本、情感 - 回報 Python、Tensorflow
2 大型歐洲銀行的事件數據集、路透社的新聞文章 2007-2014 單詞與句子 DNN+NLP預處理 相對實用性、F1分數 -
3 歐洲銀行的事件數據集、路透社的新聞 2007-2014 文本與句子 句子向量+DFFN 實用性、F1分數、AUROC -
4 路透社的新聞、財務數據 2007-2014 財務指標和新聞文本 doc2vec+NN 相對實用性 Doc2vec
5 被標記爲騙保的汽車保險公司真實數據 - 汽車、保險和事故相關特徵 DNN+LDA TP、FP、準確率、精確率、F1分數 -
6 金融交易 - 交易數據 LSTM t-SNE -
7 臺灣居民養老保險 2008-2014 保險人ID、地區編碼、性別等 RNN 準確率、全部偏差 Python
8 Stock-Twits 2015-2016 句子、Stock-Twits信息 Doc2vec、CNN 準確率、精確率、召回率、f得分、AUC Python、Tensorflow
理論與概念研究

除了上述對於算法的實際運用外,還有一些論文對模型的理論概念進行了關注,並具備其獨特的價值,如表14所示:
表 14 其餘理論與概念研究
編號 主題 數據集 時間段 特徵集 算法 性能指標 運行環境
1 AE、SVD的分析 納斯達克生物科技交易所基金指數的成分股、安進股份中的股票 2012-2014 價格數據 AE、SVD - -
2 銀行中的反欺詐 風險管理/反欺詐 - - DRL - -
注:
1.算法:SVD(Singluar Value Decomposition):奇異值分解
10.其餘金融應用領域

此外,還有一些研究與上述領域沒有包含關係,但一樣具備較大的意義,這些研究包括社會保險支付分類、銀行電話營銷成功率預測、逃稅與洗錢檢測等,具體描述如表15所示:
表 15 其餘金融應用
編號 主題 數據集 時間段 特徵集 算法 性能指標 運行環境
1 促進成交決策 標普500、韓國KOSPI指數、恆生指數和歐洲斯托克50指數 1987-2017 200天股票價格 深度Q-Learning、DNN 總利潤、相關性 -
2 肯定地下經濟的最大交易者 論壇數據 2004-2013 句子和關鍵詞 遞歸神經網絡 精確率、召回率、F得分 -
3 預測支付習慣 臺灣居民養老保險 2008-2014 保險人ID、地區編碼、性別等 RNN 準確率、全部偏差 Python
4 加速 45個芝商所的上市產品和外匯期貨 1991-2014 價格數據 DNN - -
5 基礎預測 紐交所、納斯達克交易所或美交所的股票 1970-2017 來自資金平衡表的16個基本指標 MLP、LFM MSE、年收益、SR -
6 預測銀行的電話銷售 銀行市場數據中的電話記錄 2008-2010 16個金融相關變量 CNN 準確率 -
7 公司績效預測 22家美國股票市場中的藥物公司 2000-2015 11個經濟變量、4個其餘變量 RBM、DBN RMSE、利潤 -
注:
1.算法:LFM(Lookahead Factor Models):前瞻因素模型
金融領域深度學習應用的現狀
本文回顧了144篇來自不一樣金融應用領域的論文。每篇論文根據其主題、類型、方法、數據集、特徵集和性能指標進行分析,下面咱們將提供當前金融+深度學習的摘要統計信息。
最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
如上圖所示,咱們將相關領域研究中的各類主題彙集到一塊兒,快速瀏覽圖片後能夠發現:在美國,金融文本挖掘和算法交易是研究人員研究最多的兩個領域,風險評估、情感分析、投資組合管理和欺詐檢測則緊隨其後。與此同時,該領域的研究成果大多來自於近三年,彙總圖片以下所示,這代表了該領域的時效性與活躍性。值得一提的是,2013年的全部研究都是用了RNN模型。
最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
當咱們對模型進行分組彙總時,結果以下圖所示。咱們觀察到,無論是全部年份仍是近三年,RNN一直是深度學習中的主流算法,而DMLP和CNN算法也具備本身獨到的優點。
最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
咱們經過詞雲圖(Wordcloud)對最經常使用的模型實現框架與運行環境進行了彙總,並使用扇形圖對所佔百分比進行了詳細解讀,結果以下圖所示。咱們能夠從左側扇形圖中得知,Python佔了全部運行環境中的80%,R則佔了10%,其餘10%分配給其餘各語言;右側扇形圖表示開發人員使用Python實現深度學習時使用的庫和框架,Keras、Tensorflow目前在各種庫中佔據優點地位。
最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!

頂級期刊列表以下圖所示,近3年發表論文最多的期刊包括:Expert Systems with Applications、Decision Support Systems、Applied Soft Computing、Neurocomputing、Knowledge-based Systems和European Journal of Operational Research.
最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!
此外,目前來看,DMLP通常適用於分類問題,是目前金融領域對於分類問題的首選,但因爲它是MLP的拓展,因此它的歷史比其餘深度學習模型更長。而CNN最近開始受到更普遍的關注,且近三年的應用日新月異,其在將來可能會超越其餘模型。
一些對於現狀的思考
對於模型的討論

LSTM模型目前在金融時間序列數據預測方面,是大多數研究人員首選的深度學習模型。這是因爲金融的數據大多具備時變性,這很是適合LSTM系列的算法,由於它們具備很好的適應性。與此同時,在過去的兩年裏,CNN系列模型受到研究人員的更多青睞。與LSTM不一樣,CNN對於分類問題的解決能力較強,適合靜態數據或非時變數據,這在金融領域的應用並非很是合適。但一些研究人員發現,一維時變金融數據能夠金融創新變換,將其轉換爲二維,靜態的類圖像數據,並使用CNN解決問題。這在複雜的財務模式中很是有效,而將來的走向須要時間給咱們答案。
另外一個關注度逐漸走高的模型是DRL系列,特別是與其餘算法結合時,效果較好,但複雜模型的解釋能力須要進行考慮。
與此同時,因爲目前DL庫處於開源狀態,框架也在不斷完善,其在金融領域的新型應用並非難事。值得注意的是,DL相對於ML性能較高,性能評價結果也較好,這些改進中受益最大的是算法交易模型和文本挖掘研究,在每一年增長的論文中咱們能夠找到相關依據。
2.對於應用領域的討論

在全部已應用的領域中,價格預測和算法交易模型受到更普遍的關注。而做爲已在機器學習領域嚐到甜頭的風險評估和投資組合管理,在深度學習中表現也不錯。
在金融文本領域逐漸擴大的今天,金融新聞、博客等媒體的流行爲金融界開闢了一個全新的世界,對於文字信息的解讀,能夠更好地提升性能,已有不少研究人員在這個方向不斷進行嘗試,提升模型的精度。
另外一個深度學習中的熱點領域是加密貨幣和區塊鏈,二者一般一塊兒使用。加密貨幣價格是最具吸引力的細分領域,而更多的細分領域正在進行探索。
3,待解決的問題和將來的工做

目前,雖然深度學習已爲金融領域注入了新的活力,但仍有問題須要解決。咱們將經過對現狀的梳理,從模型開發和研究主題的觀點提出對現存問題的看法:
3.1模型開發角度:

  • CNN做爲新興算法,在各個金融領域具備適應性,它爲不少問題的解決提供了機會;圖卷積網絡(Graph-CNN)與CNN密切相關但具備差別,它並無被普遍運用,這一算法仍有發展的空間。

  • 最近開發的深度學習模型,如GAN、膠囊網絡等,爲現有的實現提供可行的替代方案。它們逐漸出如今各類非金融研究中,這是一種比較好的態勢。

  • 因爲金融文本挖掘正在迅速發展,能夠對Stock2Vec等新的數據模型進行加強,以得到更好的模型。此外,基於NLP的集成模型或許能夠與圖像相結合,提升現有模型的準確性。

  • 混合模型比獨立模型更受歡迎,且這個趨勢極可能持續下去。研究人員須要引入更多通用的或很是規的模型來得到更好的結果,多是研究人員找尋正「alpha」的一個有效手段。

3.2 應用領域角度:

  • 算法交易、投資組合管理、風險評估可能會繼續在金融研究領域佔據主導地位。與此同時,一些新興領域開始獲得更普遍的關注,這對金融界的影響值得思考與關注。

  • 加密貨幣和區塊鏈技術具備可能性。它爲研究人員提供了一個很好的機會,能夠塑造將來的新金融世界,充滿着創新的但願。

  • 投資組合管理也是一個新的受益領域。機器人諮詢系統在世界範圍應用愈來愈多,這些系統依賴於高性能的自動決策系統,而深度學習模型很適合此類工做。咱們有理由相信,深度學習對於此領域的運用是將來可期的。

  • 在衍生品市場,深度學習的應用並不夠。衍生金融產品具備極強的靈活性,對計算的性能要求極高,深度學習能夠進行更多的嘗試。其中,期權策略優化、期貨交易、期權訂價、套利交易等均可以從深度學習中受益。

  • 情感分析、文本挖掘、風險資產訂價多是將來的發展方向,它們已受到研究人員的關注,但仍未充分利用。

  • 高頻交易領域因爲須要進行快速的運算,仍未從機器學習領域獲得有效的提升。而深度學習能夠研究更多硬件方面,爲高頻交易助力。

3.3 對將來研究的建議

  • 把握區塊鏈和加密貨幣領域,目前來看是具備必要的

  • 注意文本挖掘、金融情緒分析與行爲金融學的耦合,其中隱藏着大量的機會。行爲金融學的研究並未使用深度學習,這多是因爲難以量化行爲金融學的投入與產出。但隨着文本挖掘、NLP的不斷完善,將來能夠進行嘗試。

對引言中提出問題的回覆:

經過上述分析,咱們對引言提出的問題有了更深入的理解,Q&A以下所示:
Q: 深度學習(DL)在金融領域的應用包括哪些?
A: 金融文本挖掘、算法交易、風險評估、情感分析、投資組合管理和欺詐交易是其中最受關注的領域。
Q: 目前在各領域的研究進度如何?
A:雖然深度學習模型已經在幾乎全部領域取得了比傳統模型更好地成績,但仍然具備很好的發展前景,研究人員們的熱情高漲。
Q: 還有哪些有潛力的應用領域?
A:加密貨幣、區塊鏈、行爲金融、高頻交易和衍生品市場。
Q: 哪種深度學習(DL)模型更被青睞?
A:RNN模型系列(特別是LSTM)目前發展較好,CNN和DMLP也被普遍使用。其中LSTM更適合時間序列預測,DMLP和CNN更適合分類問題的解決。
Q: 深度學習(DL)與機器學習(ML)相比,哪個更適合用做研究?
A:在大多數研究中,DL模型比ML模型表現更好。但在一些特定狀況下,ML具備更好的解決辦法。總的來講,DL比較優質。
Q: 深度學習(DL)的將來方向是什麼?
A:在不久的未來,NLP、空間數據、語義和基於文本挖掘的混合模型可能會逐漸變得重要。
結論
金融行業和學術界已經開始意識到,深度學習模型在各個領域具備極高的潛力。研究的數量正在逐年加速增加,而此時,正是高速發展的時代,愈來愈多的研究會被逐漸落實,新的模式會不斷涌入。在這篇文章中,咱們不只提供了目前研究現狀的細分領域介紹,並試圖爲將來的研究人員肯定方向。這一領域具備難以置信的機遇,而且這些機遇不會很快消失。我但願這篇文章是一個很好的契機,鼓勵對該領域感興趣的研究人員繼續探索,將深度學習進行更深度的挖掘。

最全: 深度學習在經濟金融管理領域的應用現狀彙總與前沿瞻望, 中青年學者不能不關注!

長按以上二維碼能夠閱讀Deep Learning for Financial Applications : A Survey原文

關於一些計量方法的合輯,各位學者能夠參看以下文章:①「實證研究中用到的200篇文章, 社科學者常備toolkit」、②實證文章寫做經常使用到的50篇名家經驗帖, 學者必讀系列、③過去10年AER上關於中國主題的Articles專輯、④AEA公佈2017-19年度最受關注的十大研究話題, 給你的選題方向,⑤2020年中文Top期刊重點選題方向, 寫論文就寫這些,⑥過去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的「高光時刻」路線圖。後面,我們又引薦了①使用CFPS, CHFS, CHNS數據實證研究的精選文章專輯!,②這40個微觀數據庫夠你博士畢業了, 反正憑着這些庫成了教授,③Python, Stata, R軟件史上最全快捷鍵合輯!,④關於(模糊)斷點回歸設計的100篇精選Articles專輯!,⑤關於雙重差分法DID的32篇精選Articles專輯!,⑥關於合成控制法SCM的33篇精選Articles專輯!⑦最近80篇關於中國國際貿易領域papers合輯!,⑧最近70篇關於中國環境生態的經濟學papers合輯!⑨使用CEPS, CHARLS, CGSS, CLHLS數據庫實證研究的精選文章專輯!⑩最近50篇使用系統GMM開展實證研究的papers合輯!

下面這些短連接文章屬於合集,能夠收藏起來閱讀,否則之後都找不到了。
2.5年,計量經濟圈近1000篇不重類計量文章,

可直接在公衆號菜單欄搜索任何計量相關問題,

Econometrics Circle

相關文章
相關標籤/搜索