2. 金融股票數據的另外一個形態,怎樣在業務內部流動,同時怎樣避免錯誤spa
前一篇講解了股票的原始狀態,那麼在業務過程當中,數據會變成怎樣的形態,來完成衆多奇奇怪怪的業務呢,如下將會解答。blog
首先,任何股票都有機會停市,退市。或者退市了再二次上市。騰訊
例子,阿里爸爸(9988.HK)在港交所二次上市。方法
再例如,富力地產(2777.HK),12供2股的方法向市場增發當天,停牌一天。im
這種狀況下,某些股票的數據就會斷斷續續,不連貫。數據
那麼唯一叄考的標準,就只有大盤指數的數據,纔是最信得過的依靠。img
所以把數據拿了回來,應該用大市指數的交易日,做爲整個Dataframe的index,而後注入其餘股票數據在這Dataframe,才能最完整地保證不出錯。注入
以上數據全是亂編,不用細看。co
假設邵匡概念基金,在1月9日~1月10日之間停牌分成,那麼該2天就不會有收市價。錯誤
可其餘股票0700騰訊,1299友邦是正常交易日。
因此這就避免了不少業務問題,如:
a. 邵匡概念基金和友邦的過往5天股價對比圖,由於邵匡概念基金是停牌,因此那2天不能畫到股價線。這避免了拿錯了1月2日,1月3日,1月7日,1月8日,1月11日,這樣5個交易日的數據。
b. 計算含多隻股票的板塊的貝塔值,波動率等,由於邵匡概念基金和該2天停牌,那麼計算均值應該是(370+82)/2,(騰訊+友邦)/2。而不是(370+82+0)/3,(騰訊+友邦+邵匡概念)/3,這樣計算確定尋死。