解析KDTCN:知識圖譜和深度學習模型聯合實現股票預測

背景概述

今天看了一篇論文我以爲挺有意思,一方面是講的股票預測相關,另外一方面是把深度學習和知識圖譜相結合解決一個問題。一般知識圖譜和深度學習不多有交集,通常是獨立發展的兩我的工智能領域解決問題的手段,二者如何一塊兒解決問題呢?這個也引起了個人好奇心,由於一直對知識圖譜這個領域念念不忘,在《機器學習實踐應用》最後一章還要特地加入知識圖譜的內容。網絡

論文的名字叫:<Knowledge-Driven Stock Trend Prediction and Explanation via Temporal Convolutional Network>有興趣的同窗能夠下載來本身也看一看。架構

股票預測的歷史難題

KDTCN實際上是KD和TCN的縮寫,KD指的是Knowledge-Driven,也就是知識圖譜。TCN是Temporal Convolutional Network,字面意思是臨時卷積網絡。其實在量化領域,已經有不少成熟的模型了,好比最先的Arima,到後來的RNN,再到LSTM,這些模型都是把股票預測看做是一組結構化的時間序列的時序預測問題。機器學習

KDTCN的出現,確定是爲了解決股票預測領域的一些痛點,我以爲有兩點。其一是重大突發事件對股價的影響,若是單一把股票預測當作時間序列問題,一些突發問題的影響其實很難經過時序分析獲得。好比喜聞樂見看到的,川普Twitter信息致使股價大跌:學習

d7f1c2076e742ccb719067343f2daa76.jpeg

發掘這種突發事件的最好的辦法就是經過知識圖譜去解析實時新聞,挖掘出新聞內部的核心屬性,而且判斷其對股票局勢的影響。人工智能

另外一個痛點是時間序列模型很難從數學公式層面發掘股價增或者跌的拐點,以下圖所示spa

屏幕快照 2020-09-12 下午4.35.43.png

這個可能須要將時序問題轉爲分類問題解決,經過TCN模型作分類。這也就引出了KDTCN模型的設計架構。設計

KDTCN網絡結構介紹

屏幕快照 2020-09-12 下午4.26.16.png

網絡結構分爲兩部分,左邊是一個知識圖譜的結構,右邊是TCN網絡。blog

首先介紹下知識圖譜部分。輸入新聞,而後將新聞轉換成Tuples,Tuples是個subject-predicate-object結構。舉個例子,「Britain exiting from the EU」,英國脫歐這件事對股市影響很大,那這件事的Tuple=(s=Britain,p=exiting from,o=EU)。接着把這些個Tuple輸入到構建好的Knowledge base裏,就能夠獲得Event embedding,有了embedding就進入到熟悉的二分類場景的應用了。總體過程參照下圖:事件

屏幕快照 2020-09-12 下午4.40.46.png

再說TCN,TCN是一個卷積神經網絡,它的特色是每一層的輸入和輸出神經元的個數都相同,論文中表達的意思是這樣不會出現信息丟失。另外其它跟CNN不一樣的地方我也沒太看懂,應該主要是residual connection部分吧,這塊還得再研究研究。深度學習

最終整個網絡的做用是把股票走勢預測問題變成了一個二分類問題去解決:

屏幕快照 2020-09-12 下午4.44.09.png

若是後續股價會漲,則y=1,不然y=0。經過把新聞事件輸入到知識圖譜中獲得Event embedding,以及將歷史價格數據向量化獲得Price embedding,最終的訓練集變成了Event embedding+Price embedding,經過TCN去作分類訓練,獲得最終的知識圖譜網絡和分類模型。

用知識圖譜去解析實時要點新聞,並生成Event embedding加入到訓練,這一點仍是比較有創意的。

相關文章
相關標籤/搜索