咱們在用AI來編寫量化策略過程當中,主要用到了機器學習,先來從一張圖直觀理解什麼是機器學習:人類對新問題作出有效決策依靠的是過去積累的許多經驗,並對經驗進行利用,而對機器來講,「經驗」以「數據」方式存在,機器從過去衆多「數據」中產生模型,並對新數據進行預測,這個過程就可理解爲「機器學習」。app
那麼機器學習到底要經歷哪幾個步驟,咱們如何用機器學習來構建一個完整的量化策略,下面,咱們經過一個生活中的樣例,來類比AI量化策略的工做流程,來幫助你們快速理解AI量化策略:機器學習
咱們接到了隔壁老王求助:要咱們幫他去瓜田判斷一堆西瓜的好壞,而且須要在保證正確率的狀況下獨自完成。若是咱們對此毫無經驗,那咱們應該如何應對呢?你們能夠先思考一下再與下面步驟進行對比。學習
第一步:明確目標,獲取資源。
首先咱們應明確目標,就是判斷出這堆西瓜的好壞,爲了達到這個目標,咱們應該先去另找來一堆西瓜用來學習,來積累判斷西瓜好壞的經驗。測試
第二步:資源劃分
接下來咱們要把找來的這些瓜分紅兩堆,其中第一堆瓜用來練手總結規律,爲了確保咱們總結的規律是真實可靠的,咱們用第二堆瓜來驗證咱們總結的規律。人工智能
第三步:觀察學習spa
第四步:預測
此時咱們需來驗證咱們上面總結的經驗是否知足要求,咱們拿第二堆瓜來驗證,根據第二堆瓜的顏色、大小、產地等特徵來預測第二堆瓜的好壞。orm
第五步:檢驗
最後,在預測環節中咱們得出了每一個西瓜的預測結果,爲了檢驗咱們預測結果是否準確,咱們須要切瓜來驗證咱們的預測值是否與真實狀況相符。cdn
這一過程咱們能夠表示爲流程圖:blog
類比上述挑瓜過程,咱們能夠對AI量化策略流程進行分解:排序
AI量化策略的目標(Label):人爲定義的模型預測目標,例如將來N日收益率、將來N日波動率、將來N日的收益率排序等統計量,平臺AI量化策略默認使用股票收益率做爲目標。
訓練集: 第一部分的數據用來訓練模型,類比第一堆瓜;
驗證集: 第二部分的數據用來驗證模型效果,類比第二堆瓜;
AI量化策略的特徵(features): 反映事物在某方面的表現或性質的事項,在AI量化策略中,特徵能夠是換手率、市盈率、KDJ技術指標等等
AI量化策略的標註: 咱們計算訓練集數據所在時間階段的每日目標值,好比按每日的將來N日收益率高低來定義股票的走勢好壞等級,計算出每隻股票將來N日收益率的好壞等級並標記在每隻股票上。
第四步:模型訓練
咱們經過「好壞等級」對股票進行標註貼上標籤,連同其所對應的特徵值一塊兒來構建訓練模型,類比於上述咱們獲取了第一堆瓜的大小、顏色等特徵數據以及對應切瓜驗證其’「好壞」標籤,總結出瓜的分類經驗;
第五步:預測
用驗證集數據來檢驗訓練前面構建好的模型,即檢驗模型根據驗證集的特徵數據預測出的目標值(股票走勢好壞等級)是否準確。這步類比於鑑瓜任務中根據第一堆瓜總結的鑑瓜經驗用第二堆西瓜的大小、顏色等特徵數據來判斷預測瓜的好壞。
第六步:回測
將驗證集的預測結果放入歷史真實數據中檢測,類比於鑑瓜過程當中根據第二堆瓜預測出瓜的好壞最後進行切瓜驗證。
所以,AI量化策略的構建過程也能夠用流程圖的方式表達以下:
認識了機器學習流程和AI量化策略流程,就可以理解BigQuant平臺的BigStudio實驗工做流。BigStudio實驗工做流是AI量化策略在BigStudio上的可視化展現。一個典型的AI可視化量化策略流程圖以下:
簡單劃分:
具體而言:
策略流程圖的左支是訓練集特徵數據(features)的抽取和訓練集目標(label)的標註,標註結果和訓練集特徵數據經過合併和數據缺失值清洗處理,而後傳給機器學習模型進行模型訓練。
策略流程圖的右支是測試集特徵數據的抽取,經過缺失值清洗處理,而後傳給機器學習模型進行預測,這裏機器學習模型採用StockRanker模型,是一個排序模型,預測的結果是每日的股票排名。
這個排名列表即預測結果最後傳給回測模塊按必定的規則進行買賣模擬交易,進行檢測。
以上就是一個AI量化策略構建大致流程,初學者可先嚐試修改特徵值來尋找有效因子,每每好的因子組合是策略成功的關鍵。
快來新建一我的工智能量化策略檢測一下你的學習成果吧,在新建策略過程當中,回想一下每一步操做對應咱們上述的第幾步,掌握後,你已經能夠超越60%的傳統交易員啦,快快行動起來!