人工神經網絡:一些誤解(四)

摘要: 那些年咱們錯誤理解了人工神經網絡,想知道錯在什麼地方嗎?快來學習一下吧。

被錯誤理解的人工神經網絡(一)!算法

被錯誤理解的人工神經網絡(二)!編程

被錯誤理解的人工神經網絡(三)!安全

並非全部的數據均可以去訓練神經網絡

神經網絡表現不好的最大緣由之一是人們沒有正確的進行預處理即將被送入神經網絡的數據。數據標準化和去除冗餘信息和異常值都應該在數據被訓練前完成,這樣纔有可能提升神經網絡性能。網絡

數據標準化

數據必須標準化,由於神經網絡由經過加權鏈接在一塊兒的各類感知器層組成。每一個感知器都包含一個激活函數,每一個激活函數都有一個有效範圍(徑向基函數除外)。神經網絡中的輸入必需要在這個範圍內縮放,以便神經網絡可以區分不一樣的輸入模式。架構

例如,考慮一個神經網絡交易系統,它接收關於一組證券的指標做爲輸入,並輸出每一個證券是應該買仍是賣。其中一個輸入是安全性的價格(咱們正在使用Sigmoid激活函數)。然而,大多數證券的成本在每股5美圓到15美圓之間,而Sigmoid函數的輸出接近1.0。所以,全部證券的Sigmoid函數的輸出將爲1.0,全部的感知器都將觸發,神經網絡將不會學習到任何有用的知識。框架

神經網絡對未處理的數據進行訓練,並不會產生任何價值。機器學習

異常清除

異常值是一組數據中明顯跟總體數據風格不同的數值。異常值會致使統計技術出現問題,如迴歸分析和曲線擬合,由於當模型試圖適應異常值時,模型在全部其餘數據上的表現會惡化。函數

clipboard.png

此圖顯示了從線性迴歸的訓練數據中移除異常值的效果,結果與神經網絡至關。性能

上圖顯示,試圖將異常值歸入線性迴歸模型會致使數據集的擬合效果不佳。異常值對非線性迴歸模型(包括神經網絡)的影響也是一樣的。所以,最好的作法是從訓練數據集中移除異常值。但識別異常值自己就是一個挑戰。這個教程將介紹一些用於異常值檢測和刪除的現有技術。學習

刪除冗餘

當兩個或兩個以上高度相關(多重共線性)的自變量被輸入神經網絡時,這會對神經網絡的學習能力產生負面影響。高度相關的輸入也意味着由每一個變量呈現的特徵信息量很小,所以能夠消除不過重要的自變量。消除冗餘變量的另外一個好處是可讓神經網絡的訓練時間能夠更短,自適應神經網絡能夠用來修剪冗餘鏈接和感知器。

神經網絡可能須要從新訓練

神經網絡並非訓練完以後,就能一勞永逸的,由於神經網絡可能會隨着時間的推移而中止工做。這不是由於神經網絡不靠譜,而是由於金融市場的自己就是一個不肯定性很高的行業。金融市場是複雜的適應性系統,意味着它們在不斷變化。昨天的工做經驗在明天可能就行不通了。這個特性被稱爲非平穩或動態優化問題,而神經網絡在處理它們方面並非特別擅長。

像金融市場這樣的動態環境對神經網絡來講很是困難。咱們如今有兩種方法是能夠隨時間對神經網絡進行再訓練或使用動態神經網絡。隨着時間的推移,動態神經網絡「跟蹤」環境變化,並相應地調整其架構和權重。隨着時間的推移它們對動態問題是自適應,可使用多解元啓發式優化算法來跟蹤隨時間變化的局部最優解。另外一種算法是多羣優化算法,即粒子羣優化的一個衍生物。此外,具備加強的多樣性或內存的遺傳算法也能夠證實在動態環境中是穩健的。

clipboard.png

下圖演示了遺傳算法隨着時間的推移如何在動態環境中發現新的最優值。這種算法也適用於模仿貿易擁擠,即市場參與者擠佔有利可圖的交易策略,從而耗盡交易機會,致使交易變得不那麼有利可圖。

神經網絡不是黑盒子

神經網絡自己就是一個黑匣子。這給但願使用它們的人帶來了不少問題,例如,基金經理不知道神經網絡如何作出交易決策,所以不可能評估神經網絡學習的交易策略的風險。一樣,使用神經網絡進行信用風險建模的銀行也沒法證實爲何客戶有特定的信用評級。咱們前面說過,最早進的特徵提取算法已經被開發來包裝成一些神經網絡架構。這些算法從神經網絡中提取知識做爲數學表達式、符號邏輯、模糊邏輯或決策樹。

clipboard.png

數學規則:算法已經開發出來,能夠從神經網絡中提取多條線性迴歸線。這些技術的問題在於規則一般很難理解;所以,這些並不能解決「黑盒子」問題。

命題邏輯:命題邏輯是處理離散值變量操做的數學邏輯分支。這些變量(如A或B)一般爲TRUE或FALSE,但它們能夠佔用離散範圍內的值,例如{BUY,HOLD,SELL}。

邏輯運算能夠應用於這些變量,如OR,AND和XOR。結果稱爲謂詞,也可使用存在或所有量詞來對集合進行量化,這是謂詞和命題邏輯之間的區別。若是咱們有一個簡單的神經網絡,即價格(P),簡單移動平均線(SMA)和指數移動平均線(EMA)做爲輸入,而且咱們能夠獲得像這樣的規則。

clipboard.png

模糊邏輯:模糊邏輯是機率和命題邏輯結合的地方。命題邏輯的問題在於絕對交易,例如BUY或SELL,TRUE或FALSE,0或1。所以,對於交易者而言,沒法肯定這些結果的置信度。模糊邏輯經過引入指定變量屬於特定域的成員函數來克服此限制。例如,一家公司(GOOG)可能屬於{域名{購買},域名{賣}}。神經網絡和模糊邏輯的組合被稱爲神經模糊系統——本研究調查討論了各類模糊規則提取技術。

決策樹:決策樹顯示在給定某些信息時如何作出決定。本文介紹如何使用遺傳編程演進安全分析決策樹,決策樹概括是從神經網絡中提取決策樹的過程。

clipboard.png

一個使用決策樹表示簡單交易策略的例子:三角形框表示決策節點,這些多是買入,持有或出售公司。

神經網絡不難實施

根據我以前的經驗,若是從頭開始編寫神經網絡是一件很是具備挑戰性的事情。但幸運的是,如今有數百個開源和專用軟件包可使神經網絡的工做變得更容易。點擊能夠得到可供量化金融使用的數據包列表。該列表並不是詳盡無遺,按字母順序排列。若是你有任何其餘意見或要添加的框架,請經過評論部分分享。

正如我所提到的,如今有數百個機器學習庫和框架。在提交任何一種解決方案以前,我建議你作一個最適合的分析,以查看哪些開源或專有機器學習軟件包或軟件最符合你的使用案例。通常來講,定量金融軟件工程和模型開發中遵循的一條很好的規則就是不要重蹈覆轍。也就是說,對於任何足夠先進的模型,你應該指望編寫一些本身的代碼。

結論

神經網絡是一類功能強大的機器學習算法。它們基於堅實的統計基礎,並已成功應用於金融模型以及多年的交易策略。儘管如此,因爲在實踐中使用它們的人失敗過,因此它們的聲譽不是很好。在大多數狀況下,不成功的神經網絡均可以追溯到不適當的神經網絡設計決策和對其工做原理的通常誤解。本文旨在闡明其中的一些誤解,但願他們可以幫助成功的實施神經網絡。

本文做者:【方向】
閱讀原文本文爲雲棲社區原創內容,未經容許不得轉載。

相關文章
相關標籤/搜索